杨永红
- 作品数:3 被引量:2H指数:1
- 供职机构:中山大学信息科学与技术学院计算机科学系更多>>
- 发文基金:北京市教委科技发展计划北京市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的MDP算法的研究
- 2012年
- 提出了一种高效的挖掘数据仓库中多维关联规则的MDP算法。MDP算法通过构造一种扩展的前缀树MDP-tree,将数据仓库中的有效信息压缩存储,再使用基于MDP-tree的MDP-mining方法快速发现有趣的关联规则。MDP算法仅需要扫描一次数据仓库,就可以构造出MDP-tree,进而得到所有的关联规则。该算法还具有频繁模式查找简捷、二次查找迅速等优点。通过实验验证了MDP算法的高效性和稳定性,与传统的多维关联规则算法相比有更好的性能。
- 高集荣田艳杨永红党运峰
- 关键词:数据挖掘多维关联规则
- 基于特征分选策略的中文共指消解方法被引量:2
- 2011年
- 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。
- 李渝勤甘润生杨永红施水才
- 关键词:共指消解自然语言处理支撑向量机数据词典
- 基于误分类模式的乳腺癌诊断研究
- 2017年
- 乳腺癌已经成为当今世界影响妇女健康的重要疾病。对于乳腺癌诊断来说,当一个恶性病例被误分类为良性病例的时候,其代价远远大于一个良性病例被误分类为恶性病例。它利用数据挖掘领域的代价敏感相关方法,建立一个识别良性乳腺肿瘤和恶性乳腺肿瘤的诊断预测系统。在建模过程中充分考虑到误分类代价的因素,提出了误分类代价策略。通过一系列实验验证了所建立的模型。从实验结果来看,Adaboost与SVM的误分类组合分类算法在正确率和总误分类代价两个评估指标上得到了良好的效果。
- 高集荣田艳杨永红刘清华
- 关键词:数据挖掘乳腺癌