郭建兵
- 作品数:6 被引量:7H指数:2
- 供职机构:苏州大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金江苏省企业博士创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Deep Web中基于表单特征的松弛方法
- 2012年
- 在Deep Web数据集成系统中进行查询松弛时,面对众多异构数据源的属性,如何来判断松弛的先后顺序目前没有很好的方法。根据表单特征来判定属性的重要程度,提出一种针对Deep Web环境的属性松弛顺序判定方法。同时在结果的排序过程中考虑影响松弛结果与查询条件相似性的主要因素,提出了一种更为高效的排序方法。实验结果表明了该方法的有效性。
- 陈明郭建兵赵朋朋崔志明
- 关键词:深网数据集成
- 基于DOM树与领域本体的Web抽取方法被引量:5
- 2012年
- 为解决异构DeepWeb结果页面中数据区域及数据记录的自动抽取问题,提出一种基于DOM树与领域本体的Web抽取方法。利用数据内容特征以及领域本体库标记DOM树的节点,按照结果页面展示规律定位数据区域,根据改进的简单树匹配算法,定位数据区域及数据记录。实验结果表明,该方法定位数据区域及数据记录的F-measure值比传统的抽取方法高2.93%~6.67%。
- 郭建兵崔志明陈明赵朋朋
- 关键词:自动抽取DOM树领域本体
- 基于查询接口属性特征的Deep Web数据表面化方法
- 本发明在于公开了一种基于查询接口属性特征的DeepWeb数据表面化方法,包括查询接口模式信息抽取;清洗查询无关的属性;清洗垃圾属性值;属性分类;组装查询;查询集合;判断是否达到一定覆盖度;若是,则该方法流程结束;若不是,...
- 赵朋朋鲜学丰辛洁郭建兵崔志明
- 一种基于范围型属性的Deep Web数据提取方法被引量:2
- 2013年
- 针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。
- 郭建兵崔志明陈明赵朋朋
- 关键词:数据提取DEEPWEB
- 面向特定领域的Deep Web数据获取技术研究
- 随着互联网技术的飞速发展,隐藏在Web数据库中高质量的信息资源因为结构完整、数据量巨大而受到广泛的关注。然而这类信息资源只有用户向Web查询接口提交查询后才会以HTML页面的方式展现出来,使得传统的搜索引擎无法获取,因而...
- 郭建兵
- 关键词:数据获取数据抽取
- 文献传递
- 基于查询接口属性特征的Deep Web数据表面化方法
- 本发明在于公开了一种基于查询接口属性特征的Deep?Web数据表面化方法,包括查询接口模式信息抽取;清洗查询无关的属性;清洗垃圾属性值;属性分类;组装查询;查询集合;判断是否达到一定覆盖度;若是,则该方法流程结束;若不是...
- 赵朋朋鲜学丰辛洁郭建兵崔志明
- 文献传递