2025年1月23日
星期四
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
周祥增
作品数:
5
被引量:2
H指数:1
供职机构:
西北工业大学计算机学院陕西省语音与图像信息处理重点实验室
更多>>
发文基金:
陕西省自然科学基金
陕西省科学技术研究发展计划项目
国家自然科学基金
更多>>
相关领域:
电子电信
自动化与计算机技术
更多>>
合作作者
谢磊
西北工业大学计算机学院陕西省语...
张艳宁
西北工业大学计算机学院陕西省语...
李冰锋
西北工业大学计算机学院陕西省语...
付中华
西北工业大学计算机学院陕西省语...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
4篇
会议论文
1篇
期刊文章
领域
4篇
电子电信
1篇
自动化与计算...
主题
5篇
语音
3篇
语音合成
3篇
语音驱动
3篇
可视语音
3篇
可视语音合成
2篇
语音识别
机构
5篇
西北工业大学
作者
5篇
张艳宁
5篇
谢磊
5篇
周祥增
3篇
付中华
3篇
李冰锋
传媒
1篇
清华大学学报...
年份
5篇
2011
共
5
条 记 录,以下是 1-5
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于多置信特征融合语音识别拒识算法的设计与实现
牛建伟
谢磊
路晓明
周祥增
张艳宁
关键词:
语音识别
基于多置信特征融合语音识别拒识算法的设计与实现
牛建伟
谢磊
路晓明
周祥增
张艳宁
关键词:
语音识别
实时语音驱动的虚拟说话人
被引量:2
2011年
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。
李冰锋
谢磊
周祥增
付中华
张艳宁
关键词:
可视语音合成
实时语音驱动的虚拟说话人
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分...
李冰锋
谢磊
周祥增
付中华
张艳宁
关键词:
可视语音合成
文献传递
实时语音驱动的虚拟说话人
李冰锋
谢磊
周祥增
付中华
张艳宁
关键词:
可视语音合成
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张