您的位置: 专家智库 > >

陈悦

作品数:2 被引量:5H指数:2
供职机构:成都信息工程大学更多>>
发文基金:国家自然科学基金高等学校学科创新引智计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇遗传算法
  • 1篇引擎
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇搜索
  • 1篇搜索策略
  • 1篇搜索引擎
  • 1篇索引
  • 1篇特征提取
  • 1篇爬虫
  • 1篇自适
  • 1篇自适应
  • 1篇网页
  • 1篇网页过滤
  • 1篇向量
  • 1篇向量机
  • 1篇聚焦爬虫
  • 1篇基于遗传算法
  • 1篇基于支持向量...

机构

  • 2篇北京邮电大学
  • 2篇成都信息工程...

作者

  • 2篇陈悦
  • 2篇杨义先
  • 2篇胡迪
  • 2篇陈运

传媒

  • 2篇成都信息工程...

年份

  • 2篇2011
2 条 记 录,以下是 1-2
排序方式:
基于支持向量机与余弦夹角法的中文网页过滤的研究与设计被引量:2
2011年
为了进一步准确过滤对青少年危害较大的色情网页,在汉语词法分析系统添加去禁用词功能实现中文分词,通过改进的词频-逆文档频率及文档频率-互信息方法完成特征提取,从而实现基于支持向量机的过滤方案。并在给出的余弦夹角公式的基础上,提出了一种基于余弦夹角法的中文网页过滤方案。结合两种方案,实验证明在统一资源符总库存在条件下方案对色情等网页过滤效果进一步提高。
胡迪陈运杨义先陈悦
关键词:信息处理网页过滤支持向量机特征提取
基于遗传算法的聚焦爬虫搜索策略设计与研究被引量:3
2011年
网络爬虫是搜索引擎的重要组成部分。针对目前聚焦爬虫搜索策略的不足,提出了一种新的搜索策略解决方案。在搜索过程中对适应度高于或低于种群平均适应度的个体采用不同的交叉概率和变异概率来扩大爬虫的爬取范围、增加新个体,并通过改进遗传算子,提高聚焦爬虫的搜索效率。实验证明,基于自适应遗传算法的聚焦爬虫在一定程度上解决了传统遗传算法的"早熟"问题,而且能够爬取到更多主题相关的网页和相关度高的网页。
陈悦陈运杨义先胡迪
关键词:搜索引擎搜索策略聚焦爬虫遗传算法自适应
共1页<1>
聚类工具0