国家自然科学基金(61173023)
- 作品数:5 被引量:16H指数:3
- 相关作者:邹兆年李建中高宏姜守旭张海杰更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 大规模不确定图上的Top-k极大团挖掘算法被引量:3
- 2013年
- 该文研究了从不确定图中挖掘出前k个出现概率最高的极大团的问题,提出了一种基于划分的高效并行算法.在该算法中,输入的大规模不确定图首先被划分为若干互不重叠的规模较小的子图,每个子图通过扩展邻居结点信息成为扩展子图.而后,应用改进后的分支界限搜索策略,并行挖掘各个扩展子图,以得到局部top-k结果.最后,归并所有的局部top-k结果,得到全局top-k极大团.同时,该文还提出了两种预处理策略,以提高算法效率.并且严格证明了算法的正确性.在多组不确定图数据集上的实验结果表明,算法具有很高的效率和很好的实用性.
- 邹兆年朱鎔
- 不确定图上的高效top-k近邻查询处理算法被引量:8
- 2011年
- 图的不确定性普遍存在,研究不确定图的高效查询处理具有重要意义.文中提出了不确定图上一种新型查询——近邻查询.给定一个查询标签集R和距离约束σ,在不确定图G上进行近邻查询是要找到标签集包含R并且任意两个顶点间距离不超过σ的匹配顶点集.为解决该问题,文中首先提出了"可靠期望距离",然后基于可靠期望距离建立了高效的近邻关系图索引,将不确定图上的近邻查询等价地转化为近邻关系图上的团查询问题,最后使用树搜索算法解决近邻关系图上的团查询问题.理论分析和实验结果表明文中提出的算法能够高效地完成不确定图上的top-k近邻查询.
- 张海杰姜守旭邹兆年
- 关键词:近邻查询
- 动态图数据上查询与挖掘算法的研究综述被引量:1
- 2013年
- 近年来,图数据模型被广泛地用于刻画现实世界中各种各样的实体间的复杂关系。然而,在现实世界中,描述实体对象的图数据的结构和内容往往不是固定不变的,而是会随着时间的推移发生演绎与进化。目前,越来越多的研究者开始关注动态图数据方面的研究问题,也涌现除了很多优秀的研究工作。总结了近年来动态图上查询算法与挖掘算法方面的基础性研究工作,讨论了现有的工作和动态图研究的发展方向。
- 杨雅君高宏李建中
- 关键词:动态图查询算法
- 一种有效的在不确定图数据库中挖掘频繁子图模式的MUSIC算法
- 2013年
- 近年来,如何在不确定图数据库中挖掘频繁子图模式得到了越来越多的关注。该问题的主要难点在于,不仅存在着海量的可能子图模式需要检验,而且还需要做大数量的子图同构性测试来判别图中是否蕴含一个给定的模式。传统的算法是利用近似算法计算子图模式的期望支持度,但计算开销仍然十分巨大。为此提供一个基于建立在不确定数据库上的索引的算法。算法首先根据apriori性质枚举所有可能的首选子图模式,然后利用索引对候选子图模式空间进行剪枝以减少子图同构性检验从而减少期望支持度的计算开销。通过在一个真实数据集上的实验显示本算法可以有效地在不确定图数据库中挖掘频繁子图模式。
- 王文龙李建中
- 异构信息网上的可达性查询被引量:4
- 2016年
- 随着图数据规模的爆炸式增长,其形式也越来越复杂.异构信息网可建模成包含多种类型的顶点和多种类型的边的图.例如,文献数据库、在线购物网站等.首次研究异构信息网上的可达性查询问题.利用不同类型顶点之间的关系,查询2个顶点满足路径模式的可达性,该问题的时间复杂度是多项式的.然而在大规模的网络上,每次查询遍历一遍网络的时间开销也是不能容忍的.现有的可达性查询问题主要分为2类:k跳可达性查询和带有标签约束的可达性查询.但是这2种问题的算法都不能用于解决异构信息网上的可达性查询问题.因此,为了实现高效的在线查询,提出一种新的索引结构,通过路径模式的分解,预先计算部分路径模式的可达信息.当在线查询到来时,在路径模式的偏序图上,快速找到索引结构中存在的路径子模式,高效地计算查询结果.在真实和人工数据集上进行了大量实验,验证了算法的有效性.
- 尹丹高宏邹兆年李建中
- 关键词:查询处理可达性索引