山东省自然科学基金(ZR2011FQ024) 作品数:5 被引量:6 H指数:1 相关作者: 倪崇嘉 张爱英 王继强 更多>> 相关机构: 山东财经大学 山东财政学院 更多>> 发文基金: 山东省自然科学基金 国家自然科学基金 山东省高等学校科技计划项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
汉语和英语音高重音自动标注方法的对比与分析 2012年 虽然汉语和英语的重音自动标注被广泛的研究,但是关于汉语和英语的重音自动标注之间对比的研究还鲜有报道。基于汉语韵律标注库ASCCD和英语韵律标注库Boston University Radio News Corpus,对汉语和英语的重音自动标注的异同进行对比,考察不同的特征在不同语言的语料库上的泛化性能。通过基于集成分类回归树的重音自动标注实验、特征分析及基于互信息的重音自动标注的声学对比,得到如下结论:在相同的条件下,汉语重音自动标注的正确率比英语重音自动标注的正确率要低;在重音自动标注中,词典语法相关特征比声学相关的特征更重要;不同的声学信息源在重音自动标注中所起的作用不同,时长相关的特征对汉语和英语重音自动标注都很重要;英语中大部分特征提供的互信息要比汉语相应的特征提供的互信息要高。 倪崇嘉 刘文举 徐波关键词:自动标注方法 重音 汉语 音高 BOSTON 分类回归树 组合最优化与计算复杂性综述 被引量:3 2013年 综合论述了组合最优化理论与计算复杂性理论,尤其是NP-完备理论之间的密切关系,揭示出NP-完备理论研究的重大理论和现实意义。 王继强基于多语言语音数据选择的资源稀缺蒙语语音识别研究 被引量:1 2018年 利用多语言信息可以提高资源稀缺语言识别系统的性能。但是,在利用多语言信息提高资源稀缺目标语言识别系统的性能时,并不是所有语言的语音数据对资源稀缺目标语言语音识别系统的性能提高都有帮助。文中提出利用长短时记忆递归神经网络语言辨识方法选择多语言数据以提高资源稀缺目标语言识别系统的性能;选出更加有效的多语言数据用于训练多语言深度神经网络和深度Bottleneck神经网络。通过跨语言迁移学习获得的深度神经网络和通过深度Bottleneck神经网络获得的Bottleneck特征都对提高资源稀缺目标语言语音识别系统的性能有很大的帮助。与基线系统相比,在插值的Web语言模型解码条件下,所提系统的错误率分别有10.5%和11.4%的绝对减少。 张爱英关键词:数据选择 资源稀缺 基于音频事件检测和分类的音频监控系统背景模型自适应方法研究 被引量:1 2016年 随着监控系统中音频传感器应用的与日俱增,音频事件检测与分类已成为一个重要的研究课题。音频系统所处的音频环境(不同场所、不同噪声)非常复杂,以致检测与分类音频事件异常困难。因此,进行背景模型自适应从而适应不断变化的音频环境变得十分重要。提出了利用受限的最大似然线性回归方法对背景模型进行自适应。采用实际监控场景中的音频数据和模拟录制数据,研究了背景模型自适应方法以及如何有效地进行背景模型自适应。实验结果表明背景模型自适应可以提高目标声音事件的检测性能,减少系统误报。 张爱英 倪崇嘉关键词:监控系统 资源稀缺蒙语语音识别研究 被引量:1 2017年 随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注。以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能。借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型。通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能。融合多个不同识别结果以进一步提高识别精度。与基线系统相比,多种系统融合的识别绝对错误率减少12%。 张爱英 倪崇嘉关键词:资源稀缺