2024年7月15日
星期一
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
王鹏坡
作品数:
1
被引量:4
H指数:1
供职机构:
解放军电子工程学院网络工程系
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
王晓斌
解放军电子工程学院网络工程系
石昭祥
解放军电子工程学院网络工程系
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
信息抽取
1篇
页面
1篇
粒度
1篇
粒度分析
1篇
后缀树
1篇
半结构化
1篇
抽取
机构
1篇
解放军电子工...
作者
1篇
石昭祥
1篇
王鹏坡
1篇
王晓斌
传媒
1篇
计算机工程与...
年份
1篇
2009
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
自动粒度选择的半结构化页面信息抽取
被引量:4
2009年
半结构化页面的数据记录间存在结构相似性,在先序遍历DOM树生成的标记序列中表现为重复出现的模式,可利用后缀树进行挖掘。由于标记序列可以在块粒度和文本粒度两个级别上展现,而不同粒度下产生的最佳抽取模式在抽取效果方面又表现出不确定性,因此提出一种自动粒度选择的半结构化页面信息抽取方法。算法从后缀树获取的重复模式中选取最大重复和串联重复构成候选模式集,通过特征参数确定两个粒度各自的最佳模式集,最后引入抽取结果规则度参数并进行综合评价,以确定抽取模式完成半结构化页面数据记录的自动抽取。
王晓斌
王鹏坡
石昭祥
关键词:
信息抽取
粒度分析
后缀树
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张