鲁婷
- 作品数:2 被引量:18H指数:1
- 供职机构:合肥工业大学计算机与信息学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于中心文档的KNN中文文本分类算法被引量:17
- 2011年
- 在浩瀚的数据资源中,为了实现对特定主题的搜索或提取,文本自动分类技术已经成为目前研究的热点。KNN是一种重要的文本自动分类方法,KNN能够处理大规模数据,且具有较高的稳定性,但面临分类速度较慢的问题。以KNN方法为基础,引入特征项间的语义关系,并根据语义关系进行聚类生成中心文档,减少了KNN要搜索的文档数,提高了分类速度。仿真实验表明,该算法在不损失分类精度的情况下,显著提高了分类的速度。
- 鲁婷王浩姚宏亮
- 关键词:中文文本分类语义相似度聚类
- K-近邻中文文本分类方法的研究
- 在浩瀚的数据资源中,为了实现对特定主题的搜索或提取,文本自动分类技术已经成为目前研究的热点。K-近邻(KNN)是一种重要的文本自动分类方法,能够处理大规模数据,且具有较高的稳定性。本文在全面概述中文文本分类的基础上,对K...
- 鲁婷
- 关键词:文本分类语义相似度数据处理
- 文献传递