公共文化服务平台

杜利民: 作品数：86 被引量：588H指数：10; 供职机构：中国科学院声学研究所更多>>; 发文基金：国家重点基础研究发展计划国家自然科学基金更多>>; 相关领域：电子电信自动化与计算机技术语言文字化学工程更多>>

合作作者

汉语塞音选择性特征自动萃取的小波变换方法被引量：6: 1996年; 本文提出了汉语语音导引特征的概念，讨论了语音导引特征在自动语音识别中用于导引匹配搜索的运用方式和重要作用；提出并设计了汉语塞音选择性特征自动萃取的小波变换方法和数字信号处理算法。本文方法和算法从声学信号处理和检测的角度，将汉语清辅音声波输入信号自动分为塞音子集ＢＤＧ：｛ｂ，ｄ，ｇ｝、塞音子集ＺＺＨＪＧＰＴｃＣＨＱＫ：｛ｚ，ｚｈ，ｊ，ｇ，ｐ，ｔ，ｃ，ｃｈ，ｑ，ｋ｝和擦音集ＦｓＳＨｈＸ：｛ｆ，ｓ，ｓｈ，ｘ，ｈ｝；对输入的合清辅音的音节，计算检测并输出汉语自动语音识别系统可以利用的清辅音类属标记ｂ．ｄ．ｇ、ＳＴＯＰ／ＢＤ和ｆ．ｓ．ｓｈ．ｘ．ｈ以及它们的音段起始时标；从声学信息计算检测的角度为汉语自动语音识别系统提供一种新的“从粗到细”的辅助匹配结构。算法可用性模拟实验采用实际语音的数据库数据，以手工标注信息作为自动检测分类正确与否的对比标准。对１２６７个汉语全音节中，总数９１３个待分类清辅音的初步分类结果表明：正确分类率分别为ｂ．ｄ．ｇ：９６．１％，ＳＴＯＰ／ＢＤ：９５．１％和ｆ．ｓ．ｓｈ．ｘ．ｈ：８９．０％，总体平均正确分类率为９３．６％。; 杜利民侯自强; 关键词：小波变换

基于MMSE准则的基频模型被引量：2: 2005年; 在声调与语调相互作用理论的基础上，该文利用最小均方误差准则有效地提取了连续语流基频曲线的高音线及低音线，从量化的角度证实了高音线及低音线对连续语流基频曲线的作用及其区别。该文还对声调与语调相互作用的数学模型做了初步探讨，建立了基频曲线的双线调节及调中值模型，为合成系统基频灵活有效地调整提供了新的手段，提高了语音合成系统的自然度。; 刘浩杰杜利民; 关键词：语音信号处理最小均方误差准则

基于双语语料的单个源语词汇和目标语多词单元的对齐被引量：7: 2003年; 多词单元包括固定搭配、多词习语和多词术语等。本文提供了一个基于双语口语语料库的自动对齐单个源语词汇和目标语多词单元的算法 ,算法一方面通过计算对应于同一个源语词汇 ,多个目标语词汇之间的互信息和t值的归一化差值的大小来衡量目标语多个词语之间的关联程度以提取多词单元 ,另一方面通过计算互信息和t值的平均值作为多词单元和单个源语词汇之间互为相互翻译的衡量程度 ,用局部最优、首尾禁用词过滤以及长词优先等策略很好地解决了这个问题。另外 ,对短语翻译词典的分级 ,有效地减少了高级别词典中非正确翻译项的数目 ,使得翻译词典具有更好的实用性。; 陈博兴杜利民; 关键词：双语语料目标语机器翻译双语对齐翻译词典

基于音频的电视新闻节目的主题检索和聚类: 2007年; 随着流媒体应用的蓬勃兴起,基于媒体内容的检索和管理逐渐成为当前的学术研究热点。新闻节目作为电视节目的一种常见形式,对其主题进行自动提取检索具有重要的实际意义。该文从电视新闻节目的音频入手,综合应用了播音室语音/非播音室语音分类、说话人转换点检测以及按说话人聚类等多种技术,实现了对电视新闻节目的主题的检索和聚类。实验表明,该文中的方法能够找到新闻节目中96%以上的播音室段落,并对其进行准确归类,显示了这种方法的可行性和潜在价值。; 王磊杜利民王劲林; 关键词：音频分类说话人聚类贝叶斯信息准则

汉语连续语音识别中不同基元声学模型的复合被引量：9: 2006年; 该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。; 张辉杜利民; 关键词：语音识别错误率

多预测子融合实时连续语音识别输出词正误判别被引量：1: 2005年; 本文在采用堆栈译码词网重估输出作为识别最终输出的连续语音识别实时解码条件下,利用决策树方法将多个预测子融合,对识别输出词进行正确和错误的判别。本文首先构造了词后验概率、词长、相邻词的后验概率、词的声学和语言得分等共13个预测子,然后利用决策树方法,通过选择不同的预测子组合方式和适当的决策树建树参数,筛选出预测子的最佳组合,建立优化的决策树进行输出词的正误判别。实验结果表明:利用局域词图计算的词后验概率与词长、相邻词的后验概率等几种实时预测子融合后,对识别输出词的正误判别能力得到提高,并且在实时性和分类效果两个方面优于n-best输出的相应结果,相对于基线系统,则分类错误率下降41.4%。实验结果也表明本文提出的相邻词的后验概率是相对重要的预测子。; 付跃文杜利民; 关键词：计算机应用中文信息处理连续语音识别决策树

自动语音识别研究的人工神经网络方法被引量：1: 1996年; 本文概括介绍支撑自动语音识别(ASR)技术的科学原理,简要叙述工程技术、计算机技术和数学对发展这一技术的贡献。然后围绕自动语音识别三大基本原理,讨论人工神经网络(ANN)在这一领域研究的典型问题、方法原理、求解方法、性能水平对比,以及局限性和进一步研究的问题。; 杜利民侯自强; 关键词：语音识别自动识别神经网络

语音识别错误的分类分析被引量：1: 2005年; 大词表连续语音识别系统由多个组件构成,识别错误受多种因素的影响。系统开发者需要分析错误发生的不同原因。根据语音识别的基本理论给出了对错误进行分类分析的原理,将识别错误按错误原因分为解码错误、声学模型错误、语言模型错误、声学和语言复合错误四大类,并对分类后的错误做了统计分析。实验证明,识别错误的分类分析为系统的改进提供了参考依据。; 付跃文杜利民

汉语语音清辅音的预分类: 1997年; 本文提出了一种汉语清辅音的分类方法和数字信号处理算法.这种方法从语流中捕捉塞音的重要特征──冲直条以及清浊音的界限,在此基础上将汉语含清辅音的单音节划分为塞音和非塞音,塞音又进一步划分为非进气塞音和送气塞音或塞擦音.方法的数字信号处理算法在进行有效性模拟实验时,对汉语1267个全音节中的910个清辅音作这种分类体系的预分类的平均正确率达92.4%.表明这种声学预处理方法和数字信号处理算法对汉语语音识别系统原理和机制的改进有实际应用价值.这个数字信号处理方法应用了短时傅立叶变换.; 胡洪涛杜利民; 关键词：语音识别特征提取

汉语语音识别中基元HMM的训练策略的研究: 1997年; 在基于HMM的语音识别系统中,基元HMM的训练至关重要.由于基元HMM的训练过程并非是一个全局最优过程,因此基元HMM初始参数的选择和对训练过程的控制,将对最后训练结果有重要影响.合理地选择初始参数和控制训练过程,可在其它条件相同的情况下,得到更好的训练效果.本文讨论了几种初始参数的选择和对训练过程的控制策略以及它们对最后识别结果的影响.; 皮晓波杜利民候自强; 关键词：语音识别 HMM

杜利民

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

杜利民

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈