阚言东
- 作品数:1 被引量:0H指数:0
- 供职机构:南京工业大学电子与信息工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于粗糙集的Web文本分类方法
- 2009年
- 随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点。传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响。提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果。
- 阚言东倪茂树刘国庆
- 关键词:文本分类向量空间模型粗糙集