王鹏
- 作品数:3 被引量:12H指数:1
- 供职机构:中山大学信息科学与技术学院计算机科学系更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- SA:一种有利于多属性范围查询的多维聚簇方法被引量:1
- 2009年
- 一般来说,外存访问的数据文件中针对多属性的区域查询有两个改进其效率的方向。一个是在其上建立索引,另一个是在物理层按照某种规律重新安排记录。探讨如何通过第二种方法来提高范围查询的效率,即通过多维聚簇的方式得到数据文件中更好的记录的存储顺序。首先,细致分析了该问题,并针对该问题构造了一个数学模型,然后通过引入光谱算法(SA)的思想为解决该NP难问题提供了一种多项式时间内的近似解。最后通过实验来验证了该方法在矩形区域查询和单维范围查询方面的有效性。
- 吴凌坤汤庸王鹏舒然
- 关键词:数据重组范围查询
- RP-Tree:一种高效紧凑的高维点访问方法
- 随着计算机应用的不断发展和深入,高维数据的应用也越来越广泛.而传统的数据库索引技术如B+-Tree并不能提供高效的多维数据的存取.提出一种高效的多维点访问方法RP-Tree,该方法基于R-Tree结构,通过在插入算法中引...
- 吴凌坤舒然王鹏
- 关键词:多维索引数据库索引
- 文献传递
- 基于XML的自动学习Web信息抽取被引量:11
- 2008年
- 因特网给我们提供了巨大的信息量,在信息量极其丰富的Web资源中,蕴涵着大量有用的知识信息。信息爆炸而知识匮乏是当今人们所面临的一个很重要的问题。通过搜索引擎来查找信息将不容易定位到用户最感兴趣的数据上。而通过Web信息抽取的自动化实现,可以提高信息获得的效率。信息抽取可以从网络上分析和发现有用的信息,废弃冗余的数据,提取用户知识领域的知识。本文分析了基于XML的Web信息提取,讨论了相关技术在Web信息抽取中的应用并建立了相应的Web信息抽取模型,通过自动学习来获取信息抽取规则,实现Web信息的自动提取。
- 冀高峰汤庸道炜吴桂宾黄帆王鹏
- 关键词:信息提取半结构化规则库XML