黄树成 作品数:81 被引量:135 H指数:6 供职机构: 江苏科技大学计算机科学与工程学院 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 江苏省研究生培养创新工程项目 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 建筑科学 更多>>
一种融合多尺度残差注意力的医学图像分割方法 本发明公开了一种融合多尺度残差注意力的医学图像分割方法,步骤是:对采集的数据集预处理后进行训练集、验证集、测试集划分;数据增强,在训练过程中采用0.5的概率对数据进行随机垂直翻转、随机水平翻转和随机旋转;构建多尺度残差注... 李晓彤 束鑫 李俊娴 范燕 华伟 黄树成基于光流和自编码器的微表情检测方法 2023年 微表情检测广泛应用在谎言识别、心理健康和情感分析等场合,构建微表情检测模型需要充足的训练数据,但是标注微表情需要过高的成本,导致自发性微表情样本库数量过少,给微表情检测带来了极大的挑战。针对这个挑战提出一种新的微表情检测方法FLOW-AENET:提取人脸的光流特征,将光流特征作为自编码器的输入,利用深度学习模型对特征进行处理,再将学习到的特征加入SVM分类器中做二分类,在含有微表情的一类中,根据ROIS区域的变化程度判断出微表情产生的起始帧、顶峰帧和结束帧。在CASEME、CASME II等数据集上进行实验研究,结果表明,FLOW-AENET方法相比于其他方法具有明显的优势。 黄树成 罗德广关键词:SVM分类器 一种用于中文数据清洗的近邻排序算法 被引量:8 2018年 为了解决传统近邻排序算法(SNM)在中文重复值数据清洗中的不足,提出基于中文分词和同义词检查的重复值清洗算法。传统SNM算法主要适用于英文,英文和中文存在以下两种明显差异:英文语义和时态基于单词;中文语义基于词语,时态基于语义。以上两种差异造成了英文重复值清洗的算法SNM不能很好地应用于中文重复值清洗中。算法的基本思路是:引入编辑距离来计算近似度;采用中文分词和同义词检查的方式优化编辑距离相似度算法,改进后的算法可以对中文语句或者字段进行有效重复值清洗的工作。通过对供应商商品库存数据集的实验,结果证明该算法不但可以提高效率,而且能有效地清洗重复字段,很好地实现了中文数据清洗。 张培根 黄树成关键词:数据清洗 结合文本语义图和词频统计的网页分类算法研究 被引量:2 2020年 为解决网页分类算法中仅考虑文本内容或仅考虑词义本身而引起的角度过于单一的问题,提出一种在文本语义图的基础上加入对文本词语频次考察的网页分类算法。首先通过词林相似度和相关性挖掘两种方式构建文本语义图,满足算法对文本词义相似性和相关性两方面的考察要求,引入PageRank算法计算词语词义权重值。然后对词频做统计,充分考虑词语在类内文本空间和整个文本空间的分布,对IDF算法进行改进,得到词频权重值。结合两种方式得到最终特征向量,进行网页分类。 周文文 韩斌 黄树成关键词:网页分类 PAGERANK IDF 一种实现微博兴趣挖掘的粒子群优化k-means算法 被引量:2 2020年 针对k-means在聚类微博用户感兴趣话题时存在的问题,结合粒子群算法,提出一种学习因子、时间因子随惯性权重调整的MPSO-kmeans算法。该算法通过引入随惯性权重调整的学习因子,增强了惯性权重与学习因子之间的相互作用,提高了算法的全局搜索能力和局部寻优能力。在此基础上,引入线性飞行因子以减少粒子的震荡,近一步提高局部精度搜索能力。实验表明,该算法在聚类微博数据时,具有更好的寻优能力和聚类效果。 沈超 王逊 黄树成关键词:K-MEANS算法 粒子群优化算法 惯性权重 一种基于SVM的多类文本二叉树分类算法 被引量:3 2020年 二叉树支持向量机是解决多类分类问题的算法之一,在目前多类分类算法中总体性能较优,但仍存在分类速度及分类精度不高等缺点。针对这些缺点,论文对二叉树支持向量机算法在二叉树结构及分类顺序两个方面进行改进,提出了基于类间相似度量数的二叉树构造算法。实验结果表明,论文算法具有更高的分类速度和准确度,能更好地解决多类分类问题。 宋晓婉 黄树成关键词:二叉树 支持向量机 基于多模态自监督对比学习的微表情识别方法及其系统 本发明公开了一种基于多模态自监督对比学习的微表情识别方法及其系统,将自监督对比学习和微表情识别相结合,设计一个新的微表情识别框架;引入多模态信息进行对比,利用同一样本多种模态间的关联信息,构建具有高鲁棒性和强泛化能力的模... 黄树成 周浩樑 朱霞 缪宇晗一种基于图划分的混合属性数据聚类算法 被引量:2 2013年 实际应用中存在着大量同时具有数值型和符号型属性的混合属性数据,研究混合属性数据的聚类具有重要意义。经典聚类算法仅仅处理数值型数据或符号型属性数据,对混合属性数据往往无效。现有混合属性数据聚类算法分别将数值型属性和符号型属性数据单独计算,忽视了两种属性之间的相关性,聚类效果不理想。提出一种基于图划分的混合属性数据聚类算法。算法将一行属性值定义为一个图节点,计算图节点的相似性,采用一种自适应调节属性权重的方法,将数值和符号属性的相似性统一成一个互联合相似度矩阵。用图划分方法对数据进行聚类划分,通过迭代寻优的方法调整数据之间的契合度,从而求得类内相似度最大并寻得最优解。实验结果表明,混合属性聚类算法与其他方法相比具有明显的优势。 黄树成 李甜 沙爱晖关键词:混合属性数据 图划分 谱聚类 一种抗噪的动态数据流分类算法 被引量:3 2016年 数据流中的概念漂移问题已成为数据挖掘领域研究的热点之一.现实环境中的噪声直接影响概念漂移的检测及分类效果,因此,具有良好抗噪性能的数据流分类算法有重要的研究和应用价值.据此,文中提出了一种动态数据流分类算法FDBCA(FDBSCAN based classfication algorithm).该算法使用DBSCAN的改进算法FDBSCAN来过滤噪声,以UFFT为基分类器构建加权集成模型,同时引入假设检验中的μ检验方法检测概念漂移,动态更新分类模型,具有较好的性能和分类效果.实验结果表明,同已有的数据流分类算法相比,FDBCA算法在处理带有噪声的概念漂移数据流时具有更好的分类精度. 黄树成 刘悦关键词:数据流 噪声 概念漂移 基于百度百科多特征信息的词汇相似度计算 被引量:1 2020年 作为自然语言理解的一项基础工作,词汇语义相似度度量一直是研究的重点。语义相似度度量本身是一个中间任务,它是大多数自然语言处理任务中一个必不可少的中间层次,在自然语言处理中有着广泛的应用,如词义消歧、信息检索以及机器翻译等。论文提出了一种新的基于百度百科词条信息的词汇相似度计算方法。该方法经由百科名片、词条正文,开放分类和相关词条四个部分的内容,分别计算出它们之间的相似性值,以此来获得一对词汇间的整体相似性。经试验证明,在Words-240数据集上,论文方法在词汇相似度计算上,准确率更高。 仲远 王芳 黄树成关键词:自然语言处理 词汇相似度