您的位置: 专家智库 > >

岳翔

作品数:2 被引量:7H指数:1
供职机构:中国石油大学(北京)地球物理与信息工程学院更多>>
发文基金:石油科技中青年创新基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇特征选取
  • 1篇数据约简
  • 1篇特征词
  • 1篇文本分类
  • 1篇文本文档
  • 1篇文档
  • 1篇决策表

机构

  • 2篇中国石油大学...
  • 1篇昆士兰大学

作者

  • 2篇吴卫江
  • 2篇李国和
  • 2篇岳翔
  • 1篇李洪奇
  • 1篇李雪

传媒

  • 1篇中文信息学报
  • 1篇山东大学学报...

年份

  • 1篇2015
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
一种面向连续型属性的特征选取方法
2011年
特征选取是数据约简方法之一,其对提高机器学习的效率和效果具有重要影响。根据对象在特征空间中的分布,划分连续特征空间为类别单一、边界清晰的多个子空间。依统计学意义,把各个子空间分别投影到所有特征上,获取所有不同类别子空间对当前子空间特征区分能力的评估。通过构造区分能力评估矩阵,实现特征分类能力的排序。引入特征集区分能力信息增益,结合特征分类能力排序,逐一优选特征,最终完成特征子集的求解。采用UCI(University of California Irvine)数据集进行实验,获取特征子集,利用该特征子集,提高了机器学习效率和分类精度,表明了特征选取的可行性。
李国和岳翔李雪吴卫江李洪奇
关键词:数据约简特征选取决策表
面向文本分类的特征词选取方法研究与改进被引量:7
2015年
中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响。中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性能和精度。在分析、总结多种经典文本特征选取方法基础上,以文档频为主,实现文档集中的特征词频及其分布为修正的特征词选取方法(DC)。采用宏F值和微F值为评价指标,通过实验对比证明,该方法的特征选取效果好于经典文本特征选取方法。
李国和岳翔吴卫江洪云峰刘智渊程远
关键词:文本文档特征词特征选取文本分类
共1页<1>
聚类工具0