您的位置: 专家智库 > >

张利刚

作品数:8 被引量:5H指数:1
供职机构:中国社会科学院语言研究所更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字电子电信更多>>

文献类型

  • 5篇会议论文
  • 2篇期刊文章
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 3篇语言文字
  • 2篇电子电信

主题

  • 6篇语音
  • 4篇语音信息
  • 3篇汉语
  • 2篇语音识别
  • 2篇神经网
  • 2篇神经网络
  • 2篇声调
  • 2篇人机
  • 2篇人机交互
  • 2篇自然口语
  • 2篇网络
  • 2篇工神经网络
  • 2篇泛化
  • 2篇BP网
  • 2篇BP网络
  • 1篇多模态
  • 1篇语谱图
  • 1篇语音学
  • 1篇元音识别
  • 1篇声谱图

机构

  • 7篇中国社会科学...
  • 5篇天津大学

作者

  • 8篇张利刚
  • 5篇李爱军
  • 3篇孟昭鹏
  • 2篇曹剑芬
  • 2篇李洋
  • 2篇蔡德和
  • 2篇王霞
  • 2篇胡方

传媒

  • 2篇清华大学学报...
  • 2篇第九届全国人...
  • 1篇第九届全国人...

年份

  • 2篇2008
  • 4篇2007
  • 2篇2006
8 条 记 录,以下是 1-8
排序方式:
语音学知识在语音识别中的应用:案例分析被引量:4
2008年
计算机自动语音识别中的热门话题之一就是怎样利用语音学的知识来提高识别的正确率。在早期的数字语音识别中,2与8经常容易混淆,曾经被视为一个难题。该文试图通过对这个具体案例的分析,探讨语音学特征知识在识别中的应用问题。采用声学和生理实验以及感知实验相结合的方法,探讨了2与8的区别性语音学特征及其在二者识别中的作用。结果表明:2与8的最大差异是声调,在缺乏声调信息的情况下,第3共振峰(F3)的差异是决定性的区别特征,而它们的第1(F1)和第2共振峰(F2)非常近似,在识别上没有太大作用。早期的自动识别恰恰忽略了声调这个最最显著的区别特征;而在自然语流中、尤其是非正式的语体中,有些2发音时舌尖运动不够到位,因而导致它与8的第3共振峰差异不十分明显,这些是识别中二者常常混淆的主要原因。由此可见,在自动语音识别中,加强对语音学特征知识的了解是个迫在眉睫的任务,在系统中充分地综合利用这些区别性特征信息,是提高识别率的有效途径。
曹剑芬李爱军胡方张利刚
关键词:自动语音识别声调基频声谱图
在音子识别中人工神经网络的泛化研究
在人工神经网络的泛化的作用下,虽然仅仅用数个单元音(yu、yi、ai、a、ao、wu、e等)训练而成的BP网络,但是该网络可以识别特定人的在上述单元音之间连续变化的元音(音子)。此外为了将网络泛化的输出结果转变为精细的三...
蔡德和张利刚
关键词:BP网络泛化
文献传递
面向人机交互的姿态信息与语音信息关系研究
人机交互是计算机科学的一个相当重要的研究领域。语音合成、语音识别、面部表情识别、姿势识别以及姿势合成等研究都是这一领域的重要组成部分,并且都取得了很好的进展。但是这些研究都是在单一交互通道上进行的。而现实中人与人在交际过...
张利刚
关键词:计算机科学人机交互
文献传递
汉语口语对话中姿态与语音信息关系初探
信息交互方式多种多样,以语音和姿态的表达最为自然,因此提高人机交互能力就需了解交际过程中的这两种模态对信息表达之间的关系。本文介绍了语音与姿态关系的相关理论和产生模型,并以电视访谈节目自然对话的视频和音频数据为研究对象,...
李爱军张利刚李洋孟昭鹏王霞
关键词:汉语口语语音信息人机交互
文献传递
汉语口语对话中姿态与语音信息关系初探
2008年
信息交互方式多种多样,以语音和姿态的表达最为自然,因此提高人机交互能力就需了解交际过程中的这2种模态对信息表达之间的关系。该文介绍了语音与姿态关系的相关理论和产生模型,并以电视访谈节目中自然对话的视频和音频数据为研究对象,对汉语普通话语音和姿态信息在交际过程中的关系进行了初步的研究。在语音学和姿态标注的基础上,分析了口语对话中焦点重音与姿态动作之间的关系,以及韵律边界和姿态边界之间的关系。研究发现语音上重音表达往往伴随较强烈的手部动作,而且此时手和头部动作之间有互补的现象;韵律边界和姿态边界没有时间上的对应关系,但有很大的相关性,这些结果都支持语音与姿态表达之间的关联理论。
李爱军张利刚李洋孟昭鹏王霞
关键词:自然口语语音多模态
汉语口语对话中姿态与语音信息关系初探
信息交互方式多种多样,以语音和姿态的表达最为自然,因此提高人机交互能力就需了解交际过程中的这两种模态对信息表达之间的关系。本文介绍了语音与姿态关系的相关理论和产生模型,并以电视访谈节目自然对话的视频和音频数据为研究对象,...
李爱军张利刚李洋孟昭鹏王霞
关键词:自然口语语音
文献传递
从“2”与“8”的语音辨识看语音学知识在识别中的应用前景
在早期的数字的语音识别中,2与8经常容易混淆,被称为一个难题。本文通过人对2与8的语音学特征的辨识和各种听辨实验,分析了不同的语音学特征在2与8识别中的作用,说明语音学的特征知识在语音识别中具有重要的应用前景。
曹剑芬李爱军胡方张利刚
关键词:语音识别语音学感知声调语谱图
文献传递
在元音识别中人工神经网络的泛化研究
提出了一种BP网络的泛化函数。在该函数作用下BP网络可识别连续变化的元音(己离散化)。这些元音的一部分落在BP网络训练集的目标值之上,另一部分落在这些目标值之间。为了评价泛化的效果,还提出了绝对泛化评价函数和相对泛化评价...
蔡德和张利刚
关键词:BP网络泛化
文献传递
共1页<1>
聚类工具0