张晴晴
- 作品数:24 被引量:128H指数:5
- 供职机构:中国科学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术经济管理语言文字更多>>
- 一种神经网络声学模型训练方法
- 本发明涉及一种神经网络声学模型训练方法,所述方法具体包含:步骤101)搭建基础DNN网络架构,所述DNN网络架构包含:输入层,隐含层和输出层,其中输出层用于输出三音素状态集;步骤102)对输出的三音素状态集聚类,并将聚类...
- 张晴晴陈梦喆潘接林颜永红
- 文献传递
- 有限关注视角下的股市流动性反转效应研究被引量:9
- 2020年
- 股票市场流动性从正常到缺失转变是历次金融危机的重要表现,投资者关注是信息传递到股市引发流动性变化的前提,本文以中国股票市场为研究对象,从投资者有限关注角度分析市场流动性的反转问题。研究发现,在牛市、熊市和震荡盘整不同市场周期下投资者关注度与股市流动性之间存在非对称关系,通过门限模型进一步分析其背后的原因是市场状态对投资者关注行为的调节作用,当市场状态未超过门限值时,投资者关注度与股市流动性呈正向关系,超过门限值时二者关系转变为负向。本文丰富了行为金融领域的相关理论,为投资者和相关管理部门的决策依据提供新的视角。
- 刘颖刘颖董纪昌
- 声学模型训练构造方法、及声学模型和语音识别系统
- 本发明提供一种声学模型的训练构造方法和基于训练方法的隐马尔科夫声学模型和语音识别系统,所述训练方法为:(1)基于训练数据和预先给定的状态聚类,计算得到每类的帧数统计量和类内散度矩阵。(2)对于模型中表示非语音的状态类,当...
- 张晴晴潘接林颜永红
- 电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究被引量:8
- 2016年
- 近年来,神经网络语言模型的研究越来越受到学术界的广泛关注。基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点。在电话交谈语音识别系统中,语料本身具有一定的上下文相关性,而传统的语言模型对历史信息记忆能力有限,无法充分学习语料的相关性。针对这一问题,基于LSTM-DNN语言模型在充分学习电话交谈语料相关性的基础上,将其应用于语音识别系统的重评估过程,并将这一方法与基于高元语言模型、前向神经网络(feed forward neural network,FFNN)以及递归神经网络(recurrent neural network,RNN)语言模型的重评估方法进行对比。实验结果表明,LSTMDNN语言模型在重评估方法中具有最优性能,与一遍解码结果相比,在中文测试集上字错误率平均下降4.1%。
- 左玲云张晴晴黎塔梁宏颜永红
- 关键词:语音识别
- 用于语音识别置信度的发音特征各维度分析和子集优化被引量:2
- 2011年
- 提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降。把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善。
- 孙艳庆张晴晴周瑜赵庆卫颜永红
- 关键词:语音识别发音维度隐马尔可夫模型
- 多领域系统融合在语音云系统中的应用
- 本文针对语音云系统的应用中,用户语音识别涉及领域多的问题,比较了包含各领域的通用系统和分领域识别系统的性能,结果表明分领域识别比采用通用系统有明显优势。分领域识别有前端领域判别和后端结果融合的两种方法,采用后端结果融合的...
- 陈梦喆张晴晴颜永红
- 关键词:信号处理解码器声学模型
- 语音识别中深度神经网络目标值优化被引量:4
- 2016年
- 训练深度神经网络声学模型时,所采用的强制对齐得到的目标值存在无法精准地表示出语音实际状况的问题。针对这一问题,提出一种利用前后向算法得到非0-1分布目标值的方法。由于用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续性导致的过渡边界难以分离等问题,强制对齐得到的目标值存在不合理性。新的目标值可以表示某一帧以一定概率属于邻近各状态的分布情况,更详细地描述建模单元之间的过渡,进一步还原语音的原貌,提升模型的鲁棒性。同时,为寻求模型鲁棒性和建模单元区分度之间的平衡,对算法得到的目标值进行加窗处理。在中文客服问答领域进行实验,在小数据量上验证了目标值对于训练的较大影响,并且选取窗长宽度这一参数。最后将训练数据量提升至60、80以及100 h,结果显示,新的目标值优化方法训练得到的模型在识别性能上获得提升,相对字错误率下降为1.10%~3.65%。多组实验验证新的目标值优化方法对模型训练有一定效果,在训练数据量上升的情况下依然具有有效性。
- 陈梦喆张晴晴潘接林颜永红
- 关键词:语音识别
- 社会经济中大数据“测不准”问题的研究新进展
- 2019年
- 大数据为社会经济预测提供了更丰富的数据来源和维度,但是也带来伪回归、过度拟合等预测风险,使得实际应用中"测不准"问题频繁出现。本文系统梳理"测不准"问题的定义和内涵,总结社会经济领域中"测不准"问题的形成机理,发现其主要原因是预测对象会受到预测结果的影响而改变行为决策,最新文献尝试从去噪和因果分析等角度解决这一问题。最后本文在此基础上提出一个新的大数据预测理论框架,并对未来研究进行展望。
- 刘颖刘颖
- 关键词:大数据
- 基于混合模型状态修正算法的非母语语音识别
- <正>1引言随着现代社会信息的全球化,非母语语音识别成为语音识别技术领域研究热点之一。非母语口音说话人的语音识别相对母语口音说话人而言,识别性能将会大幅度降低,特别是对于
- 张晴晴潘接林颜永红
- 文献传递
- 基于发音特征的汉语普通话语音声学建模被引量:14
- 2010年
- 将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。
- 张晴晴潘接林颜永红
- 关键词:汉语普通话声学建模发音声学模型后验概率