中国科学院声学研究所知识创新工程项目(Y154141431)
- 作品数:1 被引量:3H指数:1
- 相关作者:丁泽亚张全更多>>
- 相关机构:中国科学院中国科学院研究生院更多>>
- 发文基金:中国科学院学部咨询评议项目中国科学院声学研究所知识创新工程项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用概念知识的文本分类被引量:3
- 2013年
- 针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类.在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选.依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别.实验表明,该方法可有效降低特征空问维数,在提高分类效率的同时保证了分类效果,F_1值略有提高.与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该方法的F_1值明显高于其他3种方法,综合分类效果与SVM相当,优于KNN和Bayes.
- 丁泽亚张全
- 关键词:文本分类概念层次网络