您的位置: 专家智库 > >

国家自然科学基金(60603066)

作品数:2 被引量:5H指数:2
相关作者:叶允明孟祥乾邓斌更多>>
相关机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇爬虫
  • 1篇带宽
  • 1篇网络
  • 1篇网络爬虫
  • 1篇流水线
  • 1篇控制策略
  • 1篇负载平衡
  • 1篇负载平衡模型
  • 1篇CLUSTE...
  • 1篇ED
  • 1篇HIERAR...
  • 1篇-B
  • 1篇AS
  • 1篇NEIGHB...

机构

  • 2篇哈尔滨工业大...

作者

  • 2篇孟祥乾
  • 2篇叶允明
  • 1篇邓斌

传媒

  • 1篇计算机工程
  • 1篇微计算机信息
  • 1篇第二十四届中...

年份

  • 1篇2009
  • 1篇2008
  • 1篇2007
2 条 记 录,以下是 1-3
排序方式:
一种新的网络爬虫带宽控制策略被引量:2
2008年
网络爬虫如何在限定带宽的条件下进行爬行是一个有巨大应用价值的问题,但是目前对这个方面的研究较少,本文提出了一种基于对站点礼貌爬行的爬虫带宽控制策略,通过对不同站点下载速度的建模分析和基于礼貌爬行的访问频率控制,得到了面向站点的爬行控制算法,最后实验证明这种方法能够充分利用所限定的带宽。
孟祥乾叶允明
关键词:网络爬虫
基于流水线负载平衡模型的并行爬虫研究被引量:3
2009年
针对并行爬虫系统在多任务并发执行时所遇到的模块间负载平衡问题,提出流水线负载平衡模型(PLB),将不同的任务抽象为独立模块而达到各模块的处理速度相等,采用多线程的方式实现基于PLB的并行爬虫,根据线程的休眠和缓冲区的变化对线程数量进行动态调整以实现PLB。实验结果表明该方法具有良好的运行效率和稳定性。
孟祥乾叶允明邓斌
关键词:爬虫流水线负载平衡
HNBC:Hierarchical Neighborhood-based Clustering for Rare Events
A rare event in a data set is presented as a small cluster that is buried in other clusters.Rare events are ve...
HUANG Joshua Z
关键词:CLUSTERING
文献传递
共1页<1>
聚类工具0