程振
- 作品数:1 被引量:0H指数:0
- 供职机构:安徽科技学院理学院计算机系更多>>
- 发文基金:安徽省高等学校优秀青年人才基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 多中文搜索引擎的联合网络爬虫及LUCENCE实现
- 2012年
- 由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的轨迹,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,用户必须尝试用所有搜索引擎去找出他所要的信息。最坏的是每个引擎互相覆盖,用户会重复发现一条信息。针对现有单个引擎搜索的限制,论文提出了针对多Web源的网络爬虫的实现,将现有搜索引擎上的网页信息进行抽取,过滤、去重、排序,进行信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。
- 赵靖潘志舟梅芳婷程振钱吕见
- 关键词:网络爬虫搜索引擎