您的位置: 专家智库 > >

毛启容

作品数:50 被引量:178H指数:7
供职机构:江苏大学计算机科学与通信工程学院更多>>
发文基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目更多>>
相关领域:自动化与计算机技术电子电信文化科学机械工程更多>>

文献类型

  • 44篇期刊文章
  • 3篇会议论文
  • 3篇科技成果

领域

  • 41篇自动化与计算...
  • 4篇电子电信
  • 2篇文化科学
  • 1篇天文地球
  • 1篇机械工程

主题

  • 13篇语音
  • 10篇情感识别
  • 9篇语音情感
  • 8篇语音情感识别
  • 8篇网络
  • 6篇人脸
  • 6篇视频
  • 5篇人脸表情
  • 5篇表情识别
  • 4篇人脸表情识别
  • 4篇组播
  • 4篇组播路由
  • 4篇组播路由协议
  • 4篇路由
  • 4篇路由协议
  • 4篇AD
  • 4篇并发控制
  • 3篇学习环境
  • 3篇语义分析
  • 3篇识别方法

机构

  • 47篇江苏大学
  • 3篇南京大学
  • 3篇西安交通大学
  • 3篇江苏理工大学
  • 1篇上海交通大学
  • 1篇浙江大学
  • 1篇中山大学
  • 1篇中国联合网络...
  • 1篇江苏国光信息...
  • 1篇大连民族大学

作者

  • 50篇毛启容
  • 39篇詹永照
  • 4篇张建明
  • 4篇王进峰
  • 3篇白李娟
  • 3篇赵小蕾
  • 3篇毕明
  • 3篇周元
  • 3篇沈项军
  • 3篇李光胜
  • 3篇王敏超
  • 2篇汪满容
  • 2篇宋顺林
  • 2篇郭永洪
  • 2篇柯佳
  • 2篇李峰
  • 2篇杜守富
  • 2篇陈潇君
  • 2篇宋雪桦
  • 2篇李继东

传媒

  • 6篇计算机工程
  • 5篇计算机科学
  • 5篇江苏大学学报...
  • 4篇计算机研究与...
  • 4篇小型微型计算...
  • 3篇计算机工程与...
  • 2篇模式识别与人...
  • 2篇计算机应用研...
  • 2篇计算机辅助设...
  • 2篇中国图象图形...
  • 1篇电子与信息学...
  • 1篇通信学报
  • 1篇计算机应用与...
  • 1篇微电子学与计...
  • 1篇计算机应用
  • 1篇机械与电子
  • 1篇信号处理
  • 1篇计算机教育
  • 1篇计算机科学与...
  • 1篇2001年全...

年份

  • 2篇2024
  • 2篇2023
  • 1篇2022
  • 2篇2021
  • 4篇2020
  • 3篇2018
  • 2篇2016
  • 1篇2015
  • 6篇2014
  • 6篇2013
  • 2篇2012
  • 1篇2011
  • 1篇2010
  • 2篇2007
  • 2篇2006
  • 2篇2005
  • 5篇2004
  • 1篇2003
  • 4篇2002
  • 1篇2001
50 条 记 录,以下是 1-10
排序方式:
环境辅助的多任务混合声音事件检测方法被引量:1
2020年
在混合声音事件检测任务中,不同事件的声音信号相互混杂,从混合语音信号中提取的全局特征无法很好地表达每种单独的事件,导致当声音事件数量增加或者环境变化时,声音事件检测性能急剧下降。目前已存在的方法尚未考虑环境变化对检测性能的影响。鉴于此,文中提出了一种基于多任务学习的环境辅助的声音事件检测模型(Environment-Assisted Multi-Task,EAMT),该模型主要包含场景分类器和事件检测器两大核心部分,其中场景分类器用于学习环境上下文特征,该特征作为事件检测的额外信息与声音事件特征融合,并通过多任务学习方式来辅助声音事件检测,以此提高模型对环境变化的鲁棒性及多目标事件检测的性能。基于声音事件检测领域的主流公开数据集Freesound以及通用性能评估指标F1分数,将所提模型与基准模型(Deep Neural Network,DNN)及主流模型(Convolutional Recurrent Neural Network,CRNN)进行对比,共设置了3组对比实验。实验结果表明:1)相比单一任务的模型,基于多任务学习的EAMT模型的场景分类效果和事件检测性能均有所提升,且环境上下文特征的引入进一步提升了声音事件检测的性能;2)EAMT模型对环境变化具有更强的鲁棒性,在环境发生变化时,EAMT模型事件检测的F1分数高出其他模型2%~5%;3)在目标声音事件数量增加时,相比其他模型,EAMT模型的表现依旧突出,在F1指标上取得了2%~10%的提升。
高利剑毛启容
关键词:多任务学习
基于时间分段和重组聚类的说话人日志方法
2024年
当前的说话人日志方法大多采用标准的全局聚类的方式来区分不同说话人的语音片段,没有考虑到同一个人的声音在不同的噪声条件下具有不同的特征分布,而这会增大类内距离,从而降低聚类精度。鉴于相邻的语音片段往往包含相同的背景噪声,提出一种新的基于时间分段和重组聚类的说话人日志方法以解决上述问题。首先,将所有语音片段按时间连续性划分成多个独立的时间段,并在段内进行局部聚类;然后,将不同时间段中属于同一个说话人的语音片段重新合并。此外,在聚类时利用语音片段的邻域信息来校准它们之间的相似度。通过这种方式降低了直接在不同噪声条件下进行聚类的概率,提高了聚类精度。在公开数据集AMI SDM和VoxConverse上的实验结果表明,与基线方法相比,所提方法的日志错误率分别相对降低了34%和16%,充分证明了该方法的有效性。
朱必松毛启容高利剑沈雅馨
关键词:聚类噪声
视频事件检测分析技术及应用
詹永照毛启容彭长生宋雪桦陈潇君沈项军柯佳李峰汪满容张建明
视频监控系统在高速公路、城市交通、水上交通、重要公共场所管理等领域已得到广泛的应用。目前视频监控系统的功能大多还停留在实时采集录制、存储和提供人工交互检测上,有的系统已可针对具体环境和对象,实现相关对象的跟踪和特定事件的...
关键词:
关键词:视频监控语义建模
融合功能性副语言的语音情感识别新方法被引量:5
2014年
针对声音突发特征(笑声、哭声、叹息声等,称之为功能性副语言)携带大量情感信息,而包含这类突发特征的语句由于特征突发性的干扰整体情感识别率不高的问题,提出了融合功能性副语言的语音情感识别方法。该方法首先对待识别语句进行功能性副语言自动检测,根据检测结果将功能性副语言从语句中分离,从而得到较为纯净的两类信号:功能性副语言信号和传统语音信号,最后将两类信号的情感信息使用自适应权重融合方法进行融合,从而达到提高待识别语句情感识别率和系统鲁棒性的目的。在包含6种功能性副语言和6种典型情感的情感语料库上的实验表明:该方法在与人无关的情况下得到的情感平均识别率为67.41%,比线性加权融合、Dempster-Shafer(DS)证据理论、贝叶斯融合方法分别提高了4.2%、2.8%和2.4%,比融合前平均识别率提高了8.08%,该方法针对非特定人语音情感识别具有较好的鲁棒性及识别准确率。
赵小蕾毛启容詹永照
关键词:语音情感识别自适应权重
基于遗传算法的交通视频事件多特征选择方法
2013年
为了提高交通视频事件检测的准确性和检测速率,提出了一种基于遗传算法的交通视频多特征选择方法.该方法首先提取交通视频的多种特征,尽可能多地获取各种视频事件的信息,然后将这些特征进行融合,得到一个可以表征事件的高维冗余的特征向量,再采用遗传算法对多特征进行优化筛选,最后使用SVM分类器进行训练获得低维的最优特征子集并应用于交通事件检测.实验结果表明,该方法在降低提取特征的维数的同时,可有效提高交通视频事件检测的准确率和检测速率.
孙佳瑶詹永照毛启容王敏超
关键词:交通事件检测遗传算法
基于可分度和支持度的模糊密度赋值融合识别算法被引量:5
2012年
模糊积分理论可有效处理分类决策不确定性问题.当前模糊密度的确定方法未考虑各个分类器识别结果的可区分程度及各分类器对识别结果的支持程度,会丢失融合识别的相关信息.文中提出基于可分度和支持度的自适应模糊密度赋值融合识别算法.该算法根据各分类器对待识别样本的识别结果的可区分程度和支持程度对分类器的融合模糊密度进行自适应赋值,从而有效实现多分类器融合识别.将该算法应用于自然交互环境下的人脸表情识别和Cohn-Kanade表情识别.实验结果表明,该算法能有效提高总体表情识别率.
詹永照张娟毛启容
关键词:模糊密度人脸表情识别
基于D-S证据的多语段融合语音情感识别被引量:3
2010年
为获得更丰富的情感信息、有效识别长语音的情感状态,提出基于D-S证据理论的多粒度语段融合语音情感识别方法。采用2种分段方法对语音样本分段,用SVM对语段进行识别,再利用D-S证据理论对各语音段识别结果进行决策融合,得到2种分段方法下语音的情感识别结果,将这2个识别结果进一步融合得到最终结果。实验结果表明,该方法具有较好的整体识别性能,能有效提高语音情感的识别率。
陆捷荣詹永照毛启容
关键词:语音情感识别D-S证据理论
实时分布式协同编辑系统的研究与开发被引量:3
2002年
文章以实时性、分布式为重点,介绍了实现实时分布式协同编辑系统的总体结构,着重研究了乐观锁机制的并发控制策略,最后简要介绍了该系统的协同感知处理。
毛启容詹永照毕明
关键词:软件开发并发控制协同感知
基于特征分组的多核融合在线自适应识别算法被引量:1
2013年
为提高C-SVM的泛化性能,提出一种基于特征分组的多核融合在线自适应识别算法.此算法首先把特征按照待识别样本集的特性分为若干组,然后根据各组特征的特性采用不同的核函数训练C-SVM模型,并分别把各个模型支持向量间的相似度作为其权重系数,通过自适应样本不断调整权重系数和模型参数,使得C-SVM模型的参数能够随着待识别样本特性的变化而自适应地变化.将此算法应用于非特定人语音情感识别系统,与RBF核、多项式核和Sigmoid核的对比证明了多核融合在线自适应识别算法的优越性,通过与中性语句归一化方法相比证明了本文算法的有效性和稳定性.
王治锋毛启容詹永照
关键词:C-SVM在线自适应相似度矩阵语音情感识别
基于拓扑稀疏编码预训练CNN的视频语义分析被引量:1
2018年
视频特征的深度学习已成为视频对象检测、动作识别、视频事件检测等视频语义分析方面的研究热点.视频图像的拓扑信息对描述图像内容的关联关系有着重要的作用,同时综合视频序列特性考虑以有标签的视频进行优化学习,将有利于提高视频特征表达的可鉴别性.基于上述考虑,提出一种基于拓扑稀疏编码预训练CNN的视频特征学习方法并用于视频语义分析,该方法将视频特征学习分为2个阶段:半监督视频图像特征学习和有监督的视频序列特征的优化学习.1)在半监督视频图像特征学习中,构建了一个新的拓扑稀疏编码器用之于预训练各层神经网络参数,使视频图像的特征表达能反映图像的拓扑信息,并在图像特征学习的全连接层以有标签的视频概念类别进行逻辑回归微调网络参数.2)在有监督的视频序列特征的优化学习中,构建了视频特征学习的全连接层,综合有标签的视频序列关键帧特征,建立逻辑回归约束,微调网络参数,以实现类别更具可鉴别的视频特征的优化.在典型的视频数据集上进行了相关方法的视频语义概念检测实验,实验结果表明:所提出的方法对视频特征的表达更具可鉴别性,能有效提高视频语义概念检测率.
程晓阳詹永照毛启容詹智财
关键词:视频语义卷积神经网络
共5页<12345>
聚类工具0