您的位置: 专家智库 > >

国家自然科学基金(60973081)

作品数:4 被引量:2H指数:1
相关作者:杨艳刘勇沈中辉唐明珠钟颖莉更多>>
相关机构:黑龙江大学更多>>
发文基金:国家自然科学基金黑龙江省自然科学基金黑龙江省教育厅科学技术研究项目更多>>
相关领域:自动化与计算机技术自然科学总论更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 4篇自动化与计算...
  • 1篇自然科学总论

主题

  • 3篇数据库
  • 3篇关系数据库
  • 2篇频繁子图
  • 2篇子图
  • 2篇模式图
  • 2篇关键词查询
  • 2篇查询
  • 1篇短语
  • 1篇短语识别
  • 1篇信息检索
  • 1篇数据挖掘
  • 1篇搜索
  • 1篇搜索系统
  • 1篇频繁子图挖掘
  • 1篇频繁子图挖掘...
  • 1篇关键词
  • 1篇关键词搜索
  • 1篇候选
  • 1篇TOP-K
  • 1篇查询方法

机构

  • 5篇黑龙江大学

作者

  • 4篇杨艳
  • 2篇何天宇
  • 2篇刘勇
  • 1篇郭雪泉
  • 1篇钟颖莉
  • 1篇唐明珠
  • 1篇沈中辉
  • 1篇屈松
  • 1篇郭玉林

传媒

  • 1篇计算机研究与...
  • 1篇华中科技大学...
  • 1篇高技术通讯
  • 1篇智能计算机与...

年份

  • 1篇2013
  • 3篇2012
  • 1篇2011
4 条 记 录,以下是 1-5
排序方式:
频繁子图挖掘算法gSpan的设计与实现
2011年
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。
郭玉林刘勇
关键词:频繁子图
KWSDS:关系数据库中Top-k关键词搜索系统被引量:2
2012年
关系数据库中的关键词搜索技术已经成为信息检索领域的研究热点,它为没有任何SQL语法知识的用户提供了一个简单友好的接口.但是现存的关键词搜索系统主要依赖于数据图或模式图,而单独使用数据图或模式图的算法搜索效率不高,结果准确率也较低.设计实现了一个Top-k关键词搜索系统(keyword search system based on database graph and schema graph,KWSDS),用户提交关键词后,系统对关键词进行预处理,消除一些脏关键词.首次提出使用数据图与模式图相结合的方法,设计了同表查询算法和异表查询算法,分析了算法的正确性和时间复杂度,并且提出了相关性结果排序方法.KWSDS系统的搜索算法运行时间短,搜索结果准确性高,具有良好的查询性能.最后通过实验验证了KWSDS的效率.
唐明珠杨艳郭雪泉沈中辉钟颖莉
关键词:关系数据库信息检索关键词搜索模式图
MRSM:挖掘具有代表性的极大频繁子图
2013年
基于随机化思想,提出了一种新的挖掘具有代表性的极大频繁子图的算法——MRSM算法。该算法在第一步挖掘极大频繁子图过程中,采用基于随机化的方法,利用已挖掘到的结果,提高算法的效率;在第二步聚类过程中,综合考虑了频繁模式在支持度和结构上的相似性,使得聚类的质量更好。在真实和模拟数据集上的实验结果证实了MRSM算法的有效性。
杨艳屈松屈松
关键词:数据挖掘
CNGM:一种新颖的候选网生成算法
2012年
提出一种新颖的候选网络生成算法,并提出完全元组集图的概念,该算法通过预处理完全元组集图,建立候选网络索引;利用关键词的非自由元组集名字来查找候选网络索引得到候选网络.本算法使得候选网络的生成利用索引来完成,理论分析和实验结果表明:该算法大大减少了候选网络的生成时间,提高了关键词搜索的效率.
杨艳何天宇
关键词:关系数据库关键词查询模式图
基于短语的关系数据库关键词查询方法
关系数据库关键词查询已经成为当前的研究热点.对于用户输入的关键词序列,现有系统以单个查询词为查询基本单位,没有考虑查询词之间的语义关系,而查询词之间的语义关系对于查询处理具有重要的意义.用户输入的关键词序列经常包含很多短...
杨艳何天宇
关键词:关系数据库关键词查询短语识别
文献传递
共1页<1>
聚类工具0