蒋冬梅
- 作品数:65 被引量:67H指数:5
- 供职机构:西北工业大学更多>>
- 发文基金:国家自然科学基金陕西省自然科学基金西北工业大学基础研究基金更多>>
- 相关领域:自动化与计算机技术电子电信航空宇航科学技术生物学更多>>
- 一种飞行试验外挂式直升机桨叶运动状态测量装置及方法
- 本发明一种飞行试验外挂式直升机桨叶运动状态测量装置及方法,属于直升机飞行试验测量技术领域;包括两台高速相机、GPS授时设备、补光灯、嵌入式计算机、光接收器、外挂架和存储卡。嵌入式计算机与两台高速相机、补光灯、光接收器、G...
- 张兴国张艳宁翟正军左佳旖蒋冬梅何琦凡
- 文献传递
- 基于上下文三音素DBN模型的连续语音识别被引量:1
- 2007年
- 考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。
- 吕国云赵荣椿蒋冬梅SAHLI H
- 关键词:动态贝叶斯网络语音识别上下文相关
- 基于结构稀疏表示和内部聚类滤波的高光谱异常目标检测方法
- 本发明公开了一种基于结构稀疏表示和内部聚类滤波的高光谱异常目标检测方法,用于解决现有高光谱异常目标检测方法目标检测效率低的技术问题。技术方案是在选择初始背景像元后,利用主成分分析字典学习法学习得到鲁棒性的背景字典。稀疏向...
- 张艳宁李飞张秀伟陈妍佳张磊魏巍蒋冬梅
- 文献传递
- 基于流形特征的视频情感分析与识别
- 2010年
- 本文研究了基于Isomap的非线性降维方法,对由面部表情序列提取的面部动画参数特征进行降维,分析了降维后的流形特征空间与认知心理学情感空间之间的关系。实验结果表明,Isomap降维后的情感流形特征能够表现情感的强度变化,而且比PCA降维特征对情感强度的描述更加合理和平滑;情感识别实验也表明,使用Isomap降维流形特征的识别率要高于原始情感特征和PCA降维特征,而且对各种情感的识别结果更加均衡。
- 李青蒋冬梅Ravyse IlseSahli Hichem
- 关键词:ISOMAP流形情感空间
- 基于动态贝叶斯网络的音视频连续语音识别和音素切分被引量:4
- 2007年
- 构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。
- 吕国云蒋冬梅蒋晓悦赵荣椿侯云舒孙阿利H.SahliW.Verhelst
- 关键词:动态贝叶斯网络音视频语音识别
- 基于剪影的二维人体姿态处理方法
- 本发明公开了一种基于剪影的二维人体姿态处理方法,用于解决现有技术处理每帧图像时间长的技术问题。本发明采用人体骨架模型作为先验信息,并利用此先验信息对人体数据点集进行快速准确的分类,并根据分类结果来修正人体骨架模型,进而得...
- 张艳宁李猛杨涛林增刚蒋冬梅
- 文献传递
- 基于TMS320C6416的3D虚拟声合成系统被引量:1
- 2011年
- 本文设计了一套基于TMS320C6416芯片的3D虚拟声合成系统。利用头相关传输函数HRTF产生适用于耳机回放的3D虚拟声,使用DSP的库函数实现合成操作,通过设置中断服务程序使DSP以双缓冲机制输出音频,编写芯片的二次加载程序(bootloader)实现整个系统的脱机运行。最后通过TLC16C550芯片实现DSP与PC通信,完成测听实验。结果显示,本系统的测听方位感正确率能达到95%,且执行效率较PC上有显著提高。
- 亢宣付中华蒋冬梅田霄海须明王博
- 关键词:TMS320C6416头相关传输函数双缓冲
- 一种基于共振峰恢复和Mellin变换的非特定人语音特征提取方法被引量:3
- 2001年
- 针对非特定人语音识别中的声道长度归一化问题 ,首先研究了一种能够去掉基音激励的、基于自相关估计的共振峰 (Formant)频谱恢复方法 ,说明了不同说话人发同一元音时的频谱互为尺度化的关系 ,以及它们与同一说话人发不同元音时频谱的差别 ,然后结合具有尺度不变性的Mellin变换 ,提出了一种适用于非特定人的语音特征提取方法。在实验中 ,对从非特定人收集的 2 0个汉语元音 ,分别提取了其 FFT倒谱、Mel倒谱、FFT- Mellin倒谱及本文 Formant- Mellin倒谱 ,并用一种很直观的 F- ratio分辨率准则进行了性能评价。结果表明 ,无论是对纯净的 ,还是对带附加白噪声的发音样本 ,本文由共振峰恢复和 Mellin变换相结合得到的语音特征都具有较高的分辨率。
- 蒋冬梅赵荣椿
- 关键词:语音特征提取语音识别
- 一种用于说话人头部动画的Viseme语音识别系统
- 2004年
- Viseme是在语音驱动说话人头部动画中一种常用的为口形建立的音频 -视频模型。本文尝试建立viseme隐马尔可夫模型(HMM) ,用于驱动说话人头部的语音识别系统 ,称为前映射系统。为了得到更精确的模型以提高识别率 ,引入考虑发音口形上下文的Triseme模型。但是引入Triseme模型后 ,随着模型数量的急剧增加将导致训练数据的严重不足。本文使用决策树状态捆绑方法来缓解这一问题 ,同时引入了一种以口形相似度为基础的决策树视频问题设计方法。为了比较viseme系统的性能 ,本文也建立了一个以phoneme为基本HMM模型的语音识别系统。在评价准则上 ,使用了一种客观评价说话人头部动画的加权识别率。实验表明 ,以viseme为基本HMM模型的前映射系统可以为说话人头部提供更加合理的口形。
- 谢磊赵荣椿蒋冬梅Ilse CravyseHichem SahliWerner VerhelstJan CorlenisIgnace Lemahieu
- 关键词:三维动画计算机语音识别系统隐马尔可夫模型
- 基于信息熵的语音端点检测方法
- 1 引言语音信号的端点检测就是把语音信号从输入信号中找出来,即把语音信号和背景噪声切分开。它是语音前端处理中的一个重要环节,其准确性在很大程度上影响了语音处理(如语音编码和语音识别)的效果。有效的端点检测不仅能使处理时间...
- 毛晓梅蒋冬梅
- 文献传递