2025年3月11日
星期二
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
广东省软科学研究计划(2009B070300052)
作品数:
2
被引量:5
H指数:2
相关作者:
杨天奇
漆志辉
侯明燕
更多>>
相关机构:
暨南大学
更多>>
发文基金:
广东省软科学研究计划
更多>>
相关领域:
自动化与计算机技术
更多>>
相关作品
相关人物
相关机构
相关资助
相关领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
中文期刊文章
领域
2篇
自动化与计算...
主题
1篇
信息提取
1篇
性能研究
1篇
爬虫
1篇
主题爬虫
1篇
阈值
1篇
网络
1篇
网络爬虫
1篇
网页
1篇
网页分割
1篇
聚类
1篇
WEB信息
机构
2篇
暨南大学
作者
2篇
杨天奇
1篇
漆志辉
1篇
侯明燕
传媒
2篇
微型机与应用
年份
2篇
2011
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于网页分割的Web信息提取算法
被引量:2
2011年
针对网页非结构化信息抽取复杂度高的问题,提出了一种基于网页分割的Web信息提取算法。对网页噪音进行预处理,根据网页的文档对象模型树结构进行标签路径聚类,通过自动训练的阈值和网页分割算法快速判定网页的关键部分,根据数据块中的嵌套结构获取网页文本提取模板。对不同类型网站的实验结果表明,该算法运行速度快、准确度高。
侯明燕
杨天奇
关键词:
网页分割
信息提取
聚类
阈值
网络爬虫性能研究
被引量:3
2011年
受到学习模型爬虫的启发,主题爬虫结合网页内容和链接信息来估计网页对给定主题的相关性,得到两个新型的爬虫变种。新型爬虫强调的不仅是有学习相关网页内容的能力,而且有引向相关网页的能力,并且在查找特定主题方面的能力有质的提高。
漆志辉
杨天奇
关键词:
主题爬虫
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张