朱琪 作品数:5 被引量:12 H指数:2 供职机构: 吉林大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于最大共识的模型组合算法 被引量:1 2017年 针对原有的随机森林算法没有区别各个单分类器之间的分类优势,对分类器的组合方案进行优化,提出一种基于最大共识的模型组合算法.该算法将分类器的经验误差和泛化误差融入到分类器的权重计算中,充分发挥了单分类器的个性与优势,强化分类效果好的单分类器的优势,弱化分类效果较差的单分类器的劣势.实验结果表明,基于最大共识模型组合算法能够提升组合分类器的分类性能,在提高分类精度的同时,也具有较强的泛化能力,这一改进对于提升同类型多模型组合算法的性能具有一定指导意义. 董立岩 朱琪 李永丽关键词:模型组合 泛化误差 基于最大差距的置信度评估算法 2015年 通过分析传统基于概率度量的K邻近置信度评估方法,提出一种基于最大差距的置信度评估方法,并在UCI数据集上对两种方法进行对比实验.实验结果表明,基于最大差距的置信度评估方法在宏平均召回率、宏平均精度及所用时间上均优于K邻近置信度评估方法,从而可进一步优化半监督分类学习中数据样本的置信度评估. 董立岩 朱琪 隋鹏 孙鹏 李永丽关键词:置信度评估 半监督学习 基于最大平衡度的自适应随机抽样算法 被引量:1 2018年 针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力. 董立岩 王越群 李永丽 朱琪关键词:非平衡数据集 数据预处理 基于最小距离乘积K-means算法的改进 被引量:4 2015年 针对传统K-means算法因初始聚类中心的随机性而导致聚类结果产生很大的波动性问题,提出一种基于最小距离乘积聚类算法CAMDP(Clustering Algorithm based on Min-Distance Product),利用数次抽样技术,在得到的聚类中心集合上继续使用最小乘积法寻找最佳的初始聚类中心,较大程度减少了K-means聚类算法对初值选取的随机性。实验结果表明:改进后的K-means算法既考虑了网络结构的拓扑信息,又考虑了节点的属性特征,为社区划分提供了有力的决策支持。 贺嘉楠 高云龙 王宏杰 朱琪 董立岩关键词:聚类 社会关系 聚类中心 社会网络数据的可视化 被引量:6 2015年 为直观地分析社会群体网络,观测社会群体行为,提出了社交网络数据的可视化分析方法。该方法将社会关系网络描绘成由点和线组成的图,再对图形中的节点分布位置、节点的大小以及点线密度等进行有效分析。运用在线社会网络数据可视化分析技术,结合python可视化与python科学计算技术,增强了网站的吸附性,获得了较好的用户体验。 朱琪 于济坤 王明德 丁洪超 贺嘉楠 隋鹏 董立岩关键词:社交网络 数据可视化