您的位置: 专家智库 > >

陕西省科学技术研究发展计划项目(2011KJXX29)

作品数:1 被引量:2H指数:1
相关作者:周祥增谢磊李冰锋付中华张艳宁更多>>
相关机构:西北工业大学更多>>
发文基金:陕西省自然科学基金陕西省科学技术研究发展计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇语音
  • 2篇语音合成
  • 2篇语音驱动
  • 2篇可视语音
  • 2篇可视语音合成

机构

  • 2篇西北工业大学

作者

  • 2篇张艳宁
  • 2篇付中华
  • 2篇李冰锋
  • 2篇谢磊
  • 2篇周祥增

传媒

  • 1篇清华大学学报...

年份

  • 2篇2011
1 条 记 录,以下是 1-2
排序方式:
实时语音驱动的虚拟说话人被引量:2
2011年
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。
李冰锋谢磊周祥增付中华张艳宁
关键词:可视语音合成
实时语音驱动的虚拟说话人
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分...
李冰锋谢磊周祥增付中华张艳宁
关键词:可视语音合成
文献传递
共1页<1>
聚类工具0