牛罡
- 作品数:3 被引量:10H指数:1
- 供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粗糙集的多类CVM
- 2008年
- 标准的SVM对于训练集具有O(l3)的时间复杂度和O(l2)的空间复杂度,2005年提出的CVM具有线性的时间复杂度和与训练集大小无关的空间复杂度.本文结合粗糙集和CVM,提出了一种新的多类分类RSCVM方法,该方法对二类CVM定义上近似和下近似,然后扩展到多类情形.本文最后给出在真实世界数据集上的实验结果及其分析,显示RSCVM方法具有快速和产生较少支持向量的优点.
- 牛罡商琳
- 关键词:粗糙集下近似VECTOR
- 半监督文本分类综述
- 文本分类是人们日常工作中的经常遇到的一个问题,也是机器学习研究中一个引人入胜的领域。另一方面,半监督学习算法同时考虑有标记和无标记数据,显著的提升了学习的效果。近年来提出的一些半监督文本分类方法吸引了研究者相当的注意力。...
- 牛罡商琳
- 关键词:朴素贝叶斯方法流形正则化文本分类
- 半监督文本分类综述被引量:10
- 2011年
- 文本分类是人们日常工作中经常遇到的问题,也是机器学习的重要研究内容。半监督学习算法同时考虑有标记和无标记数据,能显著提升学习效果。给出了文本分类的定义和特点,介绍了传统的监督学习分类算法和评价指标,对半监督文本分类的特点和基础理论进行了分析,并具体介绍了一些半监督文本分类算法,如贝叶斯方法和正则化方法。
- 牛罡罗爱宝商琳
- 关键词:文本分类半监督学习朴素贝叶斯