您的位置: 专家智库 > >

国家自然科学基金(60375022)

作品数:2 被引量:45H指数:2
相关作者:吕宝粮井佐原均内山将夫申红文益民更多>>
相关机构:上海交通大学国立信息与通讯技术研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇支持向量
  • 2篇支持向量机
  • 2篇向量
  • 2篇向量机
  • 1篇特征提取
  • 1篇特征提取方法
  • 1篇文本分类
  • 1篇互信息

机构

  • 2篇上海交通大学
  • 1篇国立信息与通...

作者

  • 2篇吕宝粮
  • 1篇文益民
  • 1篇申红
  • 1篇内山将夫
  • 1篇井佐原均

传媒

  • 1篇计算机工程与...
  • 1篇计算机仿真

年份

  • 1篇2006
  • 1篇2005
2 条 记 录,以下是 1-2
排序方式:
文本分类的特征提取方法比较与改进被引量:40
2006年
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的χ2统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。为了对这些特征提取方法进行系统地比较,选择了三种代表性的分类器对《读卖新闻》文本数据库进行了分类实验。实验结果表明χ2统计方法具有最好的准确率,各种改进的特征提取方法都能提高文本分类的准确率。
申红吕宝粮内山将夫井佐原均
关键词:特征提取文本分类互信息支持向量机
最小最大模块化支持向量机改进研究被引量:5
2005年
该文提出了一种新的聚类算法以实现训练数据的等分割并将其应用于最小最大模块化支持向量机(M3-SVM)。仿真实验表明:当训练数据不是同分布时,与随机分割方法相比,该文提出的聚类算法不但能提高M3-SVM的一般化能力,缩短训练时间,还能减少支持向量。
文益民吕宝粮
关键词:支持向量机
共1页<1>
聚类工具0