您的位置: 专家智库 > >

张建平

作品数:14 被引量:42H指数:4
供职机构:中国科学院声学研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字更多>>

文献类型

  • 6篇期刊文章
  • 4篇会议论文
  • 2篇专利
  • 2篇科技成果

领域

  • 9篇电子电信
  • 3篇自动化与计算...
  • 1篇语言文字

主题

  • 9篇语音
  • 3篇语音处理
  • 3篇语音识别
  • 2篇点检测算法
  • 2篇电话卡
  • 2篇端点
  • 2篇端点检测
  • 2篇端点检测算法
  • 2篇语言模型
  • 2篇说话人识别
  • 2篇通信
  • 2篇通信机
  • 2篇子带
  • 2篇子带能量
  • 2篇回声消除
  • 2篇混合模型
  • 2篇交互功能
  • 2篇放音
  • 2篇高斯
  • 2篇高斯混合

机构

  • 14篇中国科学院
  • 2篇北京中科信利...

作者

  • 14篇张建平
  • 12篇颜永红
  • 6篇杨琳
  • 5篇潘接林
  • 3篇韩疆
  • 3篇汪俊杰
  • 3篇付强
  • 3篇国雁萌
  • 3篇刘建
  • 2篇梁春燕
  • 2篇赵庆卫
  • 2篇李明
  • 1篇张鹏远
  • 1篇潘复平
  • 1篇索宏彬
  • 1篇董滨
  • 1篇张翔
  • 1篇王迪
  • 1篇庹凌云
  • 1篇孙宝海

传媒

  • 5篇声学学报
  • 1篇计算机工程与...
  • 1篇第七届全国人...

年份

  • 1篇2013
  • 1篇2012
  • 3篇2010
  • 2篇2009
  • 2篇2006
  • 1篇2004
  • 4篇2003
14 条 记 录,以下是 1-10
排序方式:
特定领域的汉语语言模型平滑算法比较研究被引量:7
2006年
为了完成特定领域的语音识别任务,利用有限的语料建立高性能的语言模型成为提高系统性能的关键。针对此问题,对特定领域的语言模型进行了研究。提出了利用高频新词来加强模型的领域特征的方法,采取了两种方案:一种是将高频新词直接加入原有字典,并在训练过程中增加这些新词的权重,使模型更能表达与领域相关的特征;一种是基于高频新词统计出一个和领域相关的小词表,并对这两种方案进行了比较研究。通过实验研究了适合汉语语言的平滑策略。最后,实验结果表明,对于特定领域问题,语言模型平滑算法对模型性能影响较大;采用适合汉语的Witten-Bell插值平滑,可以使识别率达到88.4%,比通用模型性能相对提高了18.18%。
杨琳张建平颜永红
关键词:语言模型语音识别字典
语音识别系统
颜永红潘接林张建平赵庆卫刘建付强
研究语音识别的目的是要使机器听懂人说话,因此语音识别技术正成为信息技术中人机接口的关键技术。电信级分布式语音识别系统的研发旨在解决人机语音交互的关键技术问题,重点解决在实际应用环境下语音识别技术、音乐检索技术对噪声、信道...
关键词:
关键词:语音识别音乐检索语音处理平台负载均衡
LVCSR系统中语言模型的参数选择与性能评测
在大词表连续语音识别系统中,语言模型不仅实现了拼音到汉字的转换,同时通过语言模型概率值结合声学HMM模型匹配值能协助搜索过程中有效剪枝从而避免了搜索空间的指数膨胀。然而在LVCSR系统中,语言模型的截止(Cutoff)词...
张建平庹凌云孙宝海汪俊杰刘建颜永红
文献传递
基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
2009年
在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
杨琳张建平王迪颜永红
关键词:人工耳蜗语音处理噪声环境
基于子带能量的自适应端点检测
端点检测(Endpoint Detection)是语音识别系统的重要组成部分。它的作用是在输入信号中寻找语音的起止点,以提高语音识别的速度和准确率。本文提出一种基于子带能量的自适应端点检测算法。该算法通过统计噪声特征,把...
国雁萌潘接林颜永红韩疆张建平
文献传递
电信级分布式语音识别系统
颜永红潘接林赵庆卫刘建付强李明张建平汪俊杰董滨张鹏远潘复平国雁萌龚云波
该项目属于语音处理技术领域。该项目旨在解决人机语音交互的关键技术问题,重点解决在实际应用环境下语音识别技术、音乐检索技术对噪声、信道和口音的稳健性等难题,具体研究内容及创新点如下:针对电信应用复杂多变的噪声环境,提出了基...
关键词:
关键词:语音处理技术
口语障碍者的语音特征分析与变换
声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景。本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音。在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(G...
张建平潘接林韩疆颜永红
文献传递
一种对话交互前端的回声消除和语音检测方法
本发明涉及一种对话交互前端的回声消除和语音检测方法,包括下述步骤:利用含有录音和放音通道的电话卡作为通信机对话交互前端的声音接口卡,及利用电话卡的两个通道进行回声消除步骤得到干净的语音残差数据;然后将语音残差数据进行语音...
张建平颜永红潘接林韩疆刘建
文献传递
单通道语音增强算法对汉语语音可懂度影响的研究被引量:18
2010年
考察了当前常用的几种单通道语音增强算法对汉语语音可懂度的影响。受不同类型噪音干扰的语音经过5种单通道语音增强算法的处理后,播放给具有正常听力水平的被试进行听辩,考察增强后语音的可懂度。实验结果表明,语音增强算法并不能改进语音的可懂度水平;通过分析具体的错误原因,发现听辩错误主要来自于音素错误,与声调关系不大;而且,同英文的辨识结果相比,一些增强算法对于中、英文可懂度影响差异显著。
杨琳张建平颜永红
关键词:语音增强算法汉语语音可懂度单通道听力水平噪音干扰
长时语音特征在说话人识别技术上的应用被引量:8
2010年
本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单元内把基频、共振峰、谐波等时频特征的轨迹用Legendre多项式拟合的方法提取出主要的拟合参数,再利用HLDA的技术进行特征降维,用高斯混合模型的均值超向量表示每句话音时频特征的统计信息。在NIST06说话人1side-1side说话人测试集中,取得了18.7%的等错率,与传统的基于MFCC特征的说话人系统进行融合,等错率从4.9%下降到了4.6%,获得了6%的相对等错率下降。
张建平李明索宏彬杨琳付强颜永红
关键词:语音特征识别技术说话人LEGENDRE高斯混合模型多项式拟合
共2页<12>
聚类工具0