河北省教育厅高等学校自然科学研究项目(2009101)
- 作品数:4 被引量:2H指数:1
- 相关作者:郭景峰邹晓红柴然张伟李甲更多>>
- 相关机构:燕山大学更多>>
- 发文基金:河北省教育厅高等学校自然科学研究项目国家自然科学基金河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征索引的图相似查询过滤算法被引量:1
- 2011年
- 分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进行筛选得到候选图集。实验结果证明,该方法能准确地产生候选图集,从而提高图查询的效率。
- 邹晓红李甲郭景峰柴然
- 关键词:相似查询
- 一种有效的图索引查询算法
- 2013年
- 图是一种很强大的工具,在许多应用领域如化学化合物,生物信息,XML文档,图像处理和社会网络等应用中它可以表示其对象及它们之间的关系,而且在模式化复杂的结构数据时图发挥了越来越重要的作用.图的一个最基本的操作是图的查询处理,经典的图查询问题是给出图数据库和一个查询图,从图数据库中找出那些包含查询图作为子图的图.在本文中对于给定的查询图提出了一种有效的索引策略,在图数据库中选取具有判别力的树作为特征树,对这些特征树进行编码,将结构之间的比较转化为编码序列之间的比较,并利用特征树建立索引,提出了两种剪枝策略,过滤掉数据库中与查询图不是精确匹配的图.实验验证了所提出查询处理算法的有用性和有效性.
- 邹晓红郭聪敏郭景峰
- 关键词:特征选取索引结构剪枝
- 基于FSG的最大频繁子图挖掘算法被引量:1
- 2010年
- 图挖掘已成为数据挖掘领域研究的热点,然而挖掘全部频繁子图很困难且得到的频繁子图过多,影响结果的理解和应用。可通过挖掘最大频繁子图来解决挖掘结果数量巨大的问题,最大频繁子图挖掘得到的结果数量很少且不丢失信息,节省了空间和以后的分析工作。基于算法FSG提出了最大频繁子图挖掘算法FSG-MaxGraph;结合节点的度、标记及邻接列表来计算规范编码,提出两个定理来减少子图同构判断的次数,并应用改进后的决策树来计算支持度。实验证明,新算法解决了挖掘结果太多理解困难的问题,且提高了挖掘效率。
- 郭景峰柴然张伟
- 关键词:数据挖掘决策树子图同构
- 基于标准编码的频繁子图挖掘算法
- 2012年
- 频繁子图挖掘是图挖掘的一个重要研究课题.gSpan算法作为一种高效的子图挖掘算法具有较好的执行效率,它通过最右扩展生成频繁子图,但不能保证每次扩展得到的均为标准编码.针对此问题本文提出了一种改进的算法CSGM,它采用ADI++存储结构,能处理更大规模的图集,同时保证每次最右扩展均生成标准编码,既避免了对非标准编码图的支持度计算,也避免了对输入编码是否为标准编码的计算.在实际数据集上运行的实验结果表明它比原算法提高了挖掘效率.
- 邹晓红郑超
- 关键词:频繁子图挖掘