国家自然科学基金(61271359) 作品数:36 被引量:28 H指数:3 相关作者: 陶智 张晓俊 孙宝印 顾济华 吴迪 更多>> 相关机构: 苏州大学 东南大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 国家教育部博士点基金 更多>> 相关领域: 电子电信 医药卫生 自动化与计算机技术 理学 更多>>
采用随机森林方法的声带小结与声带囊肿识别研究 2017年 声带小结和声带囊肿作为喉部疾病中较为常见且临床症状相似的两种病症,如完全依靠医师的临床经验判断,误诊率较大。文章采用声学检测的方法,提出了一种基于决策树改进的随机森林识别算法对声带小结和声带囊肿进行识别研究。首先对声带小结和声带囊肿各参数进行相关性分析,得到各组参数的Pearson系数用以判断参数的相关性大小,进行声学参数的优化,随后采用随机森林方法进行识别研究。实验数据来源于苏州大学病理嗓音数据库。研究表明,该方法适用于声带小结和声带囊肿的识别,且最终达到81%的识别率。 徐天琪 周婉艺 葛怡雯 冯可瞧 陶智 张晓俊关键词:声带小结 声带囊肿 参数优化 病理嗓音基音频率检测方法研究 2013年 提出了一种基于LPC谱和离散小波变换的改进自相关基音频率检测算法,用于检测病理嗓音的基音频率。首先采用LPC谱特性滤除高频,得到预测余量,然后采用6级db20离散小波变换处理预测余量信号,并结合自相关法提取基音频率。采用美国MEEI公司的病理嗓音数据库进行基频检测实验。实验结果表明,本方法能够有效的去除倍频、半频的影响,是一种有效的病理嗓音基音频率检测算法。 张晓俊 陈莉 陶金 丁洋 陶智关键词:基音频率 自相关法 基于改进增益函数的电子耳蜗语音增强 被引量:1 2014年 目前在安静环境下电子耳蜗编码技术已取得较高的语音识别率,但在噪声条件下听觉感知性能下降明显。针对该问题,提出基于改进增益函数的电子耳蜗语音增强算法。以组合编码算法为基础,采用约束方差的噪声谱估计算法进行噪声功率谱估计并应用于信噪比估计。结合人耳掩蔽阈值在子频带中自适应调节增益函数,将改进的增益函数与通道选择相结合,实现电子耳蜗语音增强。实验结果表明,与采用基本谱减法前端去噪和传统增益函数的电子耳蜗语音增强算法相比,该算法的语音平均识别率分别提高了53%和22%,在保留更多语音信息的同时能有效消除背景噪声干扰。 孙宝印 周强 朱俊杰 倪赛华 陶智 顾济华关键词:电子耳蜗 语音增强 噪声估计 基于级联投影高斯混合模型的语音与心电情绪识别(英文) 被引量:1 2015年 提出了一种基于级联投影的高斯混合模型算法.首先,针对不同的特征维度计算高斯混合模型的边缘概率,依据边缘概率模型构造出多个子分类器,每个子分类器包含不同的特征组合.采用级联结构的框架对子分类器进行动态融合,从而获得对样本的自适应能力.其次,在心电情感信号和语音情感信号上验证了算法的有效性,通过实验诱发手段,采集了烦躁、喜悦、悲伤等情感数据.最后,探讨了情感特征参数(心率变异性、心电混沌特征,语句级静态特征等)的提取方法.研究了情感特征的降维方法,包括主分量分析、顺序特征选择、Fisher区分度和最大信息系数等方法.实验结果显示,所提算法能够在2种不同的场景中有效地提高情感识别的准确率. 黄程韦 吴迪 张晓俊 肖仲喆 许宜申 季晶晶 陶智 赵力关键词:高斯混合模型 情绪识别 情绪诱发 声带息肉影响发声的虚拟仿真实验研究 被引量:1 2021年 为研究声带息肉对发声流场的影响,该文结合声带的发声机制和空气动力学理论,提出一种非对称空气动力学模型。依据控制方程对声门内流场进行数值求解,研究不同息肉尺寸对声带运动及声门气流的影响。仿真实验发现,息肉的存在使声带内产生旋涡,会造成能量损失。息肉的大小会影响声带的振动,通过增加声门下压力和声门直径的方法有助于克服息肉的阻塞作用,减小声带息肉较大时对声带振动的影响。 孙宝印 张莉丽 张莉丽 王琰 张晓俊关键词:声带息肉 发声 空气动力学 气流分布 声带振动 联合多频带非线性方法的病理嗓音识别研究 2019年 文章采用多频带非线性技术,提出了一种病理嗓音识别特征的提取方法。首先采用符合人耳听觉特性的Bark子波滤波器组对语音信号进行滤波,并进行离散余弦变换提取特征,随后再提取各通道内的最大李雅普诺夫指数特征。将特征参数融合成多频带非线性参数后,采用美国MEEI病理嗓音数据库进行识别实验,并选用逻辑回归、多层感知器、支持向量机、随机森林及K最邻近分类器5种典型机器学习方法进行识别。实验结果表明,文中所提出的特征平均识别率达97%,相比梅尔频率倒谱系数、Bark频率倒谱系数、最大李雅普诺夫指数,分别有4%、4%、18%的提高,最高识别率达到99%。 赵品辉 叶翔宇 严潇远 张莉丽 陶智 张晓俊关键词:多频带 非线性 经验模态分解法识别声带息肉和声带囊肿的研究 被引量:1 2015年 为了提高声带类病理语音识别率,本文提出了一种采用经验模态分解法(Empiricial Mode Decomposition,EMD)识别声带息肉和声带囊肿的研究方法。首先采用经验模态分解法对正常语音和声带息肉类、声带囊肿类病理语音进行分解,求取语音信号的固有模态函数(IMF),经过希尔伯特-黄变换(Hibletr-Huang)变化之后,提取边际谱和特征参数用于声带类病理语音的细分。实验研究表明,采用支持向量积(SVM)边际谱和参数识别声带息肉、声带囊肿、正常语音,识别率高达90.96%。 袁悦 顾玲玲 常静雅 张晓俊 陶智关键词:声带息肉 声带囊肿 经验模态分解 希尔伯特-黄变换 采用听觉外周模型改进电子耳蜗CIS方案 被引量:2 2014年 提出了一种改进的CIS电子耳蜗的脉冲刺激方案。利用听觉外周模型产生一种符合听神经发放机制的刺激脉冲序列来刺激电极,代替传统的均匀交替刺激方案,不仅可以通过包络而且可以通过脉冲间隔来传递语音信息,确保了语音的空间编码和时间编码。听觉仿真实验表明,相对于其他两种方案,方案可以有效地传递更多更丰富的语音信息,在汉语声调识别实验中至少提高19.2%识别率,在可懂度的对比实验中具有最高可懂度。 孙文业 陶智 孙宝印 倪赛华 王振明 顾济华关键词:电子耳蜗 基于C4.5决策树的正常与甲亢嗓音识别研究 2013年 研究一种基于C4.5决策树的正常嗓音与甲亢嗓音识别方法,首先提取嗓音的基音频率,并获得与之相关的特征参数,同时与幅度微扰等参数共同组成特征集。采用美国凯益(KAY)公司的麻省眼耳科医院(Massachusetts eye and ear infirmary,MEEI)病理嗓音数据库嗓音数据进行识别,通过实验发现C4.5决策树方法与贝叶斯网络算法及支持向量机算法相比,识别率分别提高9%和15%,达到了84%的识别率。 张晓俊 丁洋 陈莉 陶金 陶智关键词:基音频率 决策树 一种复倒谱相位分解的声门波估计方法 2018年 逆滤波法估计声门波含有较多的谐波成分,为了减小这种误差,提出一种复倒谱相位分解的声门波估计方法。首先估计嗓音信号的基音周期,利用复倒谱将每个基音周期内嗓音信号分解为最大相位信号与最小相位信号,经过微分运算后与声门闭合点位置结合,实现微分声门波估计。对微分声门波积分,即为所估计的声门波。采用迭代自适应逆滤波方法和本文方法提取的声门波进行参数提取。实验结果表明,本文方法提取的声门波更能反映声带振动特性,声门开相、闭相信息明确,有效减小声源谐波成分和声道干扰。在估计微分声门波最小值时表现出最佳性能,估计误差低至0.25%。89%的时域参数与标准值的误差均小于10% 王琰 邵雅婷 张晓俊 吴迪 曾晓亮 顾济华 陶智关键词:声门波 复倒谱