黑龙江省自然科学基金(F200936)
- 作品数:13 被引量:34H指数:3
- 相关作者:孙广路郎非何勇军鲁颖欣齐宏卓更多>>
- 相关机构:哈尔滨理工大学清华大学哈尔滨工业大学更多>>
- 发文基金:黑龙江省自然科学基金国家自然科学基金黑龙江省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术电子电信医药卫生语言文字更多>>
- 数据不充分情况下的说话人识别被引量:1
- 2017年
- 在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法。目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据。而这一要求在现实应用中通常难以满足,导致其识别率急剧降低。针对这一问题,提出了一种基于稀疏编码的说话人识别方法。该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分。实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果。
- 盖晁旭梁隆恺何勇军
- 关键词:说话人识别高斯混合支持向量机
- 基于稀疏编码的鲁棒说话人识别被引量:3
- 2014年
- 目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出了一种新的基于稀疏编码的说话人识别方法。该方法用一个通用背景字典(Universal background dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化。这些字典被拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别。为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典。为了跟踪变化的噪声,采用混噪语音在线更新噪声字典。在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性。
- 何勇军孙广路付茂国韩纪庆
- 关键词:说话人识别
- 语音特征增强方法综述被引量:3
- 2014年
- 经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考.
- 何勇军付茂国孙广路
- 关键词:鲁棒性语音识别
- 基于TCP Vegas拥塞控制算法的研究与改进被引量:3
- 2011年
- 网络拥塞已经成为制约因特网发展的瓶颈.在众多TCP拥塞控制算法中,TCP Vegas表现出比其他算法更为优越的性能,但是在特定环境下也存在不足.本文通过对网络拥塞策略的研究和Vegas性能的分析,验证了Vegas整体性能优于Reno的结论,并通过分析Vegas的特点,针对α和β的值对公平性的影响,提出了一种在TCP Vegas与TCP Reno共存环境下获得良好拥塞控制的方法,并通过网络仿真证明了本方法的有效性和正确性.
- 谢怡宁孙广路苏洁翟继强
- 关键词:网络拥塞TCPVEGAS
- 模糊判断在网络安全风险评估中的应用研究被引量:9
- 2014年
- 针对网络安全风险评估过程中的模糊性问题,在分析了网络安全风险要素的基础上,将模糊判断运用于网络安全风险评估中,利用模糊隶属度理论把定性指标合理的定量化,进而将定性与定量评价相结合,得到了一种综合化程度较高的评价方法.最后以示例来说明模糊评价法的具体应用.
- 鲁颖欣王健齐宏卓
- 关键词:风险评估网络安全
- 基于合并因子的多种格式文件索引技术被引量:2
- 2012年
- 为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高.
- 孙广路易成岐郎非
- 关键词:文本检索
- 基于条件随机域和语义类的中文组块分析方法被引量:5
- 2011年
- 为了解决中文组块分析精度不高和未利用词的语义信息的问题,提出了一种基于条件随机域模型和语义类的中文组块分析方法.该方法通过研究中文组块分析任务及其序列化特性,采用条件随机域模型融合不同类型特征,克服标记偏置问题,将语义词典中抽取的语义类特征应用到中文组块分析中,提高分析精度.实验表明,该方法取得了F值为92.77%的中文组块分析性能,实验进一步还表明了特征模板的选取和训练语料的规模对于分析性能的影响.
- 孙广路郎非薛一波
- 关键词:条件随机域语义词典
- 秸秆资源海量存储系统的设计与实现
- 海量数据资源的存储和保护是目前信息存储技术中的重要问题.采用磁盘阵列进行数据存储并保护数据安全,同时利用双机热备技术保护系统的持续运行是目前海量数据存储和管理的最佳解决方案之一.依据建立秸秆资源基础数据库的需求,分析研究...
- 孙广路张洛什薛一波
- 关键词:海量存储系统磁盘阵列双机热备
- 文献传递
- 基于混合方法的流量测量系统(英文)被引量:5
- 2011年
- 流量测量是流量控制和管理中的关键问题。传统方法对于当今网络中大量出现的具备动态端口、加密载荷信息或未知协议载荷特征等特点的流量无法进行有效地测量。虽然基于机器学习模型的测量方法能够在一定程度上解决上述问题,但是由于现有特征的区分能力有限,该类方法单独使用时,难以在大规模的真实网络流量中准确地测量出某种特定协议的流量。为了解决流量测量问题,提出了基于混合方法的流量测量系统,融合了基于端口、基于特征串匹配、基于正则表达式匹配和基于机器学习模型的多种流量测量方法。在构建系统框架和相关模块的基础上,应用一种混合方法解决了基于安全套接层协议的流量测量和应用层协议分析问题。实验结果表明,该混合方法能够测量出超过99%的基于安全套接层协议的流量,并有效地分析其中不同应用层协议的流量,准确率达到93.76%。此外,在稳定而可行的内存占用率下,系统能够良好运行,总体测量结果优于开源软件OpenDPI的结果。
- 孙广路郎非杨明明
- 关键词:机器学习模型
- 企业级搜索引擎中结果聚类和查询补全技术
- 2012年
- 目前,搜索引擎技术发展迅速.但从用户的使用效果来看,传统的搜索引擎技术功能基本相似,在具体实现上仍有待提高.从提升用户体验角度出发,解决传统搜索引擎的搜索结果不能体现类别信息,并且搜索过程没有相应的智能提示的问题.研究基于Nutch的检索技术的特性和应用方法,实现了企业级搜索引擎中的搜索结果自动聚类和查询补全技术.实验结果表明,结果聚类和查询补全技术有效地提升了搜索引擎的搜索体验,增强了系统的使用价值和智能性,系统可靠性高.
- 刘强吴雨桐郎非
- 关键词:企业级搜索引擎搜索结果聚类