您的位置: 专家智库 > >

国家自然科学基金(60773106)

作品数:5 被引量:17H指数:3
相关作者:瞿裕忠李慧颖吴鸿汉程龚葛唯益更多>>
相关机构:东南大学更多>>
发文基金:国家自然科学基金江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 4篇语义网
  • 1篇引擎
  • 1篇语义WEB
  • 1篇数据分析
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇资源描述
  • 1篇资源描述框架
  • 1篇链接
  • 1篇链接分析
  • 1篇幂率分布
  • 1篇基于关键词
  • 1篇关键词查询
  • 1篇RDF
  • 1篇RDF数据
  • 1篇查询

机构

  • 5篇东南大学

作者

  • 5篇瞿裕忠
  • 2篇吴鸿汉
  • 2篇李慧颖
  • 1篇叶俊
  • 1篇葛唯益
  • 1篇程龚

传媒

  • 3篇东南大学学报...
  • 1篇计算机研究与...
  • 1篇计算机科学

年份

  • 3篇2010
  • 1篇2009
  • 1篇2008
5 条 记 录,以下是 1-5
排序方式:
基于关键词的RDF数据查询方法被引量:3
2010年
在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.
李慧颖瞿裕忠
关键词:关键词查询语义网
语义网数据分析之初探被引量:1
2008年
为了探索语义网的发展现状,用网络爬虫采集到9.859 636×106个语义网文档,构成数据集.针对该数据集,采用复杂网络分析方法,分析语义网文档的站点分布,语义网文档的大小分布,以及命名空间的使用情况等.实验结果表明:语义网文档的站点分布服从幂率分布,分布指数为0.5304;语义网文档大小的分布服从幂率分布,分布指数为1.4071;语义网文档的国家分布不均衡.与2年前比较,语义网文档数量成倍增长;语义网文档站点的分布指数由0.6515降为0.5304;语义网文档大小的分布指数由1.1833升为1.4071;命名空间的使用情况变化显著.
叶俊瞿裕忠
关键词:语义网数据分析幂率分布
语义Web链接结构分析之综述被引量:4
2010年
随着语义Web研究的发展,其数据量也不断增长,要实现语义Web追求的目标——数据的共享和重用,语义Web上的实体搜索和文档搜索必不可少。而面对这样不断增长的数据以及不同于传统Web的搜索要求,就需要使用链接结构分析来指导语义Web上的搜索。同时,语义Web的发展现状也无时无刻不吸引着研究人员的关注,而链接结构分析对于揭示其宏观结构起着关键作用。分别从实体和文档两个粒度对面向语义Web链接结构分析的研究进行总结,特别关注链接模型的构建以及链接结构分析方法的应用。
葛唯益程龚瞿裕忠
关键词:语义WEB链接分析
基于RDF句子的语义网文档搜索被引量:7
2010年
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升.
吴鸿汉瞿裕忠李慧颖
关键词:语义网搜索引擎
理解语义网实体:基于概念空间的摘要方法被引量:2
2009年
为了快速准确地理解语义网实体,提出了基于概念空间的摘要方法.针对RDF数据的无序性问题,首先将一个实体的不同侧面的RDF数据划分到不同的概念空间中去.其次在同一个概念空间中的数据依照谓语聚类的方法进行组织.对于实体重用带来的RDF数据的可信度问题,根据数据的来源,在数据的权威性维度上对实体数据进行划分.针对实体数据的大规模特性,提出实体数据摘要的方法,综合基于结构的重要性、用户偏好以及来源文档的重要性对数据的重要性进行计算.实验结果表明:基于概念空间的摘要方法能够有效地帮助人们快速理解语义网实体;该方法相对于其他RDF浏览器有4%-17%的效率提升;在用户比较熟悉RDF的情况下,使用该方法能够提高20%左右的效率.
吴鸿汉瞿裕忠
关键词:语义网
共1页<1>
聚类工具0