您的位置: 专家智库 > >

常智荣

作品数:3 被引量:4H指数:1
供职机构:北京邮电大学更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 3篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇NUTCH
  • 1篇信息采集
  • 1篇引擎
  • 1篇预处理
  • 1篇日志
  • 1篇日志挖掘
  • 1篇数据挖掘
  • 1篇数据挖掘技术
  • 1篇数据预处理
  • 1篇数字图
  • 1篇数字图书馆
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇图书
  • 1篇图书馆
  • 1篇资源采集
  • 1篇技术应用
  • 1篇WEB日志
  • 1篇WEB日志挖...

机构

  • 3篇北京邮电大学

作者

  • 3篇常智荣
  • 2篇马自卫
  • 1篇李高虎
  • 1篇邓芳

传媒

  • 1篇现代图书情报...

年份

  • 2篇2010
  • 1篇2009
3 条 记 录,以下是 1-3
排序方式:
基于Web日志的数据挖掘技术的研究
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。文中对数据预处理几种典型算法进行研究,并针对各个环节中的一些特殊处理提出了改进方法。最后,以对搜索引擎信息采...
常智荣马自卫邓芳
关键词:数据挖掘WEB日志挖掘数据预处理技术应用
文献传递
基于Nutch的专题网页资源采集服务系统的设计与实现被引量:3
2010年
在数字图书馆系统集成应用的框架下,提出基于Nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、GUI信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、Plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于Webservice的服务接口,实现其在数字图书馆资源层的集成应用。
常智荣马自卫李高虎
关键词:NUTCHWEBSERVICE
搜索引擎Nutch在数字图书馆中集成应用的研究与实现
计算机技术与通信网络技术高速发展,网页资源日益成为一种重要的学术资源形式,在数字图书馆的资源建设中受到重视。然而网络信息有着数据量大,更新速度快、分布灵活分散,无序化等特点。因此,如何实现对特定领域、学科的实时监测和有效...
常智荣
关键词:NUTCH信息采集数字图书馆
文献传递
共1页<1>
聚类工具0