您的位置: 专家智库 > >

陈松华

作品数:2 被引量:16H指数:2
供职机构:国家信息中心更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇贝叶斯
  • 2篇贝叶斯推理
  • 1篇邮件
  • 1篇数据挖掘
  • 1篇评估函数
  • 1篇文本分类
  • 1篇垃圾邮件
  • 1篇二值文本
  • 1篇反垃圾邮件

机构

  • 2篇北京科技大学
  • 2篇国家信息中心

作者

  • 2篇李明祥
  • 2篇郑雪峰
  • 2篇闫鹏
  • 2篇陈松华

传媒

  • 1篇计算机工程与...
  • 1篇计算机科学

年份

  • 2篇2008
2 条 记 录,以下是 1-2
排序方式:
关于贝叶斯推理的垃圾邮件特征选择评估函数被引量:5
2008年
在各种基于机器学习的垃圾邮件过滤系统中,特征选择是基础且非常关键的一个环节,它对整个系统的性能和效率都有直接的影响。通过对垃圾邮件特点的分析,提出了一种基于贝叶斯推理的特征选择评估函数方法。新方法运算开销较小,且能够区分出不同的特征词在体现垃圾邮件特征时所存在的差异性,因而在进行特征选择时较其它常用方法更具针对性,非常利于提高过滤系统的准确性和运行效率。
闫鹏郑雪峰李明祥陈松华
关键词:反垃圾邮件贝叶斯推理
二值文本分类中基于Bayes推理的特征选择方法被引量:12
2008年
针对二值文本分类算法中的特征选择问题,本文提出了基于贝叶斯推理的评估函数算法来替代常用的、以IG或MI为评估函数的算法;同时,提出了以评估函数值的累计贡献率表示置信度,并以此确定特征选择维度的可量化的方法。对比实验显示,本文提出的新方法具有简便易行、高效实用的优点,此算法不仅对文本分类问题,对其它各类二值分类问题中的特征选择方法研究也都具有很好的参考、借鉴价值。
闫鹏郑雪峰李明祥陈松华
关键词:数据挖掘贝叶斯推理文本分类
共1页<1>
聚类工具0