您的位置: 专家智库 > >

国家自然科学基金(60505013)

作品数:4 被引量:34H指数:2
相关作者:姜远周志华薛晓冰韩洁凌刘力平更多>>
相关机构:南京大学更多>>
发文基金:国家自然科学基金江苏省自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇数据挖掘
  • 1篇多示例学习
  • 1篇数据流
  • 1篇网络
  • 1篇网络环境
  • 1篇文本分类
  • 1篇文本分类方法
  • 1篇类方
  • 1篇分类器
  • 1篇分类器集成
  • 1篇WEB挖掘
  • 1篇ADABOO...
  • 1篇词频

机构

  • 4篇南京大学

作者

  • 4篇姜远
  • 3篇周志华
  • 1篇韩洁凌
  • 1篇薛晓冰
  • 1篇王魏
  • 1篇刘力平

传媒

  • 3篇计算机研究与...
  • 1篇江南大学学报...

年份

  • 3篇2007
  • 1篇2006
4 条 记 录,以下是 1-4
排序方式:
对Aggregative-Learning算法的分析
2007年
互联网中存在着海量的有用数据,这些数据位于世界各地的各个站点中,由于各个站点之间的通信代价,不可能收集全部站点的所有数据来训练一个全局分类器.但是每个站点都可以使用它自身的数据来训练一个本地分类器. Aggregative-Learning算法通过利用多个站点的本地分类器进行集成从而获得好的泛化能力.从理论上对Aggregative-Learning算法进行分析,并证明了为什么该算法在网络环境中具有良好的性能.
王魏姜远周志华
关键词:网络环境
数据流挖掘技术被引量:2
2007年
简要概述了数据流挖掘技术,探讨了数据流的特点.数据流的概念漂移现象,给数据流上的数据挖掘带来很大困难.由于计算机的内存有限,数据窗口技术只针对最近的数据,而最近的数据常常导致数据挖掘系统中的分类器过配,文中介绍了解决这一问题的方法,并讨论了数据流挖掘技术的应用.
姜远刘力平
关键词:数据挖掘数据流
基于词频分类器集成的文本分类方法被引量:25
2006年
提出了一种基于词频分类器集成的文本分类方法·词频分类器是在对文本中的单词和它在每个文本中出现的频率进行统计后得到的简单分类器·虽然词频分类器本身泛化能力不强,但它不仅计算代较小,而且在训练样本甚至类别增加时易于进行更新,而整个学习系统的泛化能力可以由集成学习机制来提高,因此,词频分类器很适合用做集成学习的基分类器·在集成时,使用了改进的AdaBoost算法,加入了一种强制重新分布权的机制,避免算法过早停止,更加适合文本分类任务·在标准文集Reuters-21578上的实验结果表明,该方法能取得很好的效果·
姜远周志华
关键词:文本分类ADABOOST
基于多示例学习技术的Web目录页面链接推荐被引量:8
2007年
在Web目录页面中,向用户推荐其感兴趣的链接有助于用户高效地访问网络资源.然而,用户往往不愿花费很多时间来标记训练样本,其提供的数据可能只能说明某个目录网页是否包含其感兴趣的内容,而不能明确标示出其感兴趣的具体链接.由于训练数据中缺乏对链接的标记,但预测时却需要找出用户感兴趣的链接,这就使得Web目录页面链接推荐问题相当困难.CkNN-ROI算法被提出用于解决该问题.实验表明,CkNN-ROI算法在解决这一困难的链接推荐问题上比其他一些算法更为有效.
薛晓冰韩洁凌姜远周志华
关键词:多示例学习数据挖掘WEB挖掘
共1页<1>
聚类工具0