您的位置: 专家智库 > >

龚真平

作品数:2 被引量:4H指数:1
供职机构:西南交通大学软件学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 1篇信息提取
  • 1篇增量聚类
  • 1篇增量聚类算法
  • 1篇数据挖掘
  • 1篇爬虫
  • 1篇文本相似度
  • 1篇相似度
  • 1篇聚焦爬虫
  • 1篇聚类
  • 1篇聚类算法
  • 1篇HTMLPA...

机构

  • 2篇西南交通大学

作者

  • 2篇龚真平

传媒

  • 1篇软件导刊

年份

  • 2篇2011
2 条 记 录,以下是 1-2
排序方式:
基于HTMLParser的Web文献信息提取被引量:3
2011年
基于HTMLParser对网页进行解析,可抽取标签间的Link、image、meta和title等信息。使用HTMLParser来提取Web文献中的题名、关键字、摘要、作者、来源等信息,清洗后存入MySql数据库当中,以备后续数据挖掘使用。对此进行了论述。
龚真平
关键词:HTMLPARSER信息提取
基于web文献的数据挖掘研究应用
随着高等教育的大众化,高校人数由过去的几十万上升到几百万,国家也会提供大量的资金资助大量科研项目,每年都会有数以万计的文献产生。由于Web文献的大量累积,人们很难从海量的文献数据中寻找到有用的信息,也就起不到提高工作效率...
龚真平
关键词:数据挖掘增量聚类算法文本相似度
共1页<1>
聚类工具0