您的位置: 专家智库 > >

王侨文

作品数:1 被引量:1H指数:1
供职机构:安徽科技学院理学院更多>>
发文基金:安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇网页
  • 1篇相似度
  • 1篇相似度模型
  • 1篇相似网页
  • 1篇结构化信息
  • 1篇标签

机构

  • 1篇安徽科技学院

作者

  • 1篇王侨文
  • 1篇单传佳
  • 1篇管马周
  • 1篇赵靖

传媒

  • 1篇安徽科技学院...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
自动提取布局结构相似网页的结构化信息被引量:1
2010年
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。
赵靖王侨文管马周单传佳
共1页<1>
聚类工具0