您的位置: 专家智库 > >

周思思

作品数:1 被引量:1H指数:1
供职机构:中南林业科技大学计算机与信息工程学院更多>>
发文基金:湖南省教育厅科研基金湖南省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息采集
  • 1篇信息采集技术
  • 1篇信息抽取
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇爬虫
  • 1篇网络
  • 1篇网络爬虫
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇抽取
  • 1篇AJAX

机构

  • 1篇中南林业科技...

作者

  • 1篇袁晓红
  • 1篇周思思

传媒

  • 1篇电子世界

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
社交网络信息采集技术研究与实现被引量:1
2012年
社交网站作为网络舆情的有效载体,在传播舆情方面有着重要作用。近年迅猛发展起来的微博就是一种典型的社交网站。本文针对微博类网站设计了支持Ajax(Asynchronous Java Scriptand XML)技术的网络爬虫,采用协议驱动和事件驱动结合的采集策略,将爬取分为用户爬取和内容爬取两部分,使用基于模板的抽取方法,实现了对微博数据的成功抽取和存储。抽样结果证明,支持Ajax技术的网络爬虫,较BFS爬虫相比,提高了信息采集的效率和覆盖率。随着DOM Tree复杂度的提高,还有待于设计更高灵活性的网络爬虫。
周思思袁晓红
关键词:网络爬虫社交网络WEB信息抽取AJAX
共1页<1>
聚类工具0