公共文化服务平台

SMap:基于语义的关系数据库模式与OWL本体间映射方法被引量：5: 2012年; 伴随语义网的发展,语义网本体数量激增.然而万维网上绝大多数的数据仍存储在关系数据库中.建立关系数据库模式与语义网本体间的映射是一种实现两者之间互操作性的有效途径.因此,提出了一种基于语义的关系数据库模式与OWL本体间的映射方法SMap,包含简单映射发现和复杂映射学习两个阶段.在简单映射发现阶段,首先通过逆向工程规则将关系数据库模式和本体中的元素对应地分为不同类别,再为每个元素构建虚拟文档并计算它们之间的相似度,其中针对不同类别的元素设计了不同的虚拟文档抽取方案.在复杂映射学习阶段,基于已发现的简单映射以及重叠的数据库记录和本体实例,自动化地生成训练事实数据,然后运用归纳逻辑编程算法学习出多种类型的基于Horn规则的复杂映射.真实数据集上的实验结果表明,SMap在简单映射发现和复杂映射学习上均明显优于现有的关系数据库模式与本体间映射方法.; 贾存鑫胡伟柏文阳瞿裕忠; 关键词：本体映射关系数据库虚拟文档归纳逻辑编程

一种基于OWL的语义网数据划分与并行加载方法被引量：2: 2014年; 随着语义网数据规模的爆炸式增长,海量数据存储和检索面临越来越严峻的挑战,分布式数据库与并行计算已成为其主要解决方案。基于列存储分布式数据库HBase设计了一种多表语义网数据存储模型,实现从OWL本体定义到存储模型的映射。基于OWL本体定义信息对语义网数据实现按类划分,并将三元组存储于主体所属于的类的两张表里,采用MapReduce框架实现并行的数据划分和加载任务,最后在Hadoop集群环境下对方法进行了可行性验证。; 程佳朱敏柏文阳; 关键词：语义网网络本体语言并行计算

基于无指导学习的微博评论分析方法被引量：3: 2017年; 该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该方法通过互联网搜索引擎扩展微博文本,基于相关性计算自动构造正负训练用例,生成特定的某条微博评论分类模型,通过该模型对评论的价值性进行评估。实验结果表明,该方法能够比较好地识别出评论的价值。; 徐帅帅戴新宇黄书剑陈家骏; 关键词：价值性无指导学习

VDoc+:a virtual document based approach for matching large ontologies using MapReduce被引量：4: 2012年; Many ontologies have been published on the Semantic Web,to be shared to describe resources.Among them,large ontologies of real-world areas have the scalability problem in presenting semantic technologies such as ontology matching(OM).This either suffers from too long run time or has strong hypotheses on the running environment.To deal with this issue,we propose a three-stage MapReduce-based approach V-Doc+ for matching large ontologies,based on the MapReduce framework and virtual document technique.Specifically,two MapReduce processes are performed in the first stage to extract the textual descriptions of named entities(classes,properties,and instances) and blank nodes,respectively.In the second stage,the extracted descriptions are exchanged with neighbors in Resource Description Framework(RDF) graphs to construct virtual documents.This extraction process also benefits from the MapReduce-based implementation.A word-weight-based partitioning method is proposed in the third stage to conduct parallel similarity calculation using the term frequency-inverse document frequency(TF-IDF) model.Experimental results on two large-scale real datasets and the benchmark testbed from Ontology Alignment Evaluation Initiative(OAEI) are reported,showing that the proposed approach significantly reduces the run time with minor loss in precision and recall.; Hang ZHANGWei HUYu-zhong QU; 关键词：MAPREDUCE TF-IDF

一种基于HBase的RDF数据存储模型被引量：8: 2013年; 随着语义网数据的爆炸式增长,如何高效地管理海量RDF数据成为一个关键问题.现有的集中式关系型RDF数据存储管理系统已难以适应这种需求,越来越多的研究者使用分布式系统和并行计算技术来管理海量RDF数据.提出一种基于分布式数据库HBase的RDF数据存储模型,根据OWL本体定义文件,将数据按类划分,同一类的三元组数据保存在该类的S_PO和O_PS两张表中,实现该存储模型上的8种Triple Pattern和Basic Graph Pattern查询算法,并提供部分推理功能,在Hadoop集群环境下对存储模型与查询算法进行了可行性验证.; 朱敏程佳柏文阳; 关键词：资源描述框架 SPARQL 查询处理

基于CouchDB的SPARQL查询引擎实现: 2014年; 传统的SPARQL查询引擎在处理查询时以三元组模式为基本单位做查询优化处理,在三元组模式较多时存在着过多的连接操作,开销比较大。文中基于文档数据库的存储和查询特点,提出一种利用主语分类的方式来存储RDF数据的方法,将不同的RDF三元组按主语分成不同的类,并存入文档数据库的文档中。在处理SPARQL查询时将三元组模式也按照主语分类,构成以主语相关块为单位的查询图,并提出一种基于属性相关性的选择度估计方法来优化查询执行计划。文中利用文档数据库CouchDB实现了新的SPARQL查询引擎,实验证明文中的方法能够提高SPARQL基本图模式查询的效率。; 彭义倪传蕾柏文阳; 关键词：文档数据库查询优化

语义Web中对象共指的消解研究被引量：7: 2012年; 随着语义Web的快速发展,语义Web数据大幅增长.在语义Web中,单个对象很可能由多个不同的标识符(例如URI)指称.语义Web中,对象共指的消解是识别语义Web中指称相同对象的不同标识符,并消除描述这些标识符的RDF(resource description framework)数据之间不一致性的过程,它对于语义Web数据的融合、搜索、浏览等具有重要作用.首先,形式化定义了语义Web中对象共指的消解问题;然后,从对象共指识别使用的特征、数据冲突的消解方式、对象共指消解方法的适用范围、现有原型系统和基准测试集这5个方面调研了最新的研究进展;最后,讨论了尚存的挑战,并展望未来可能的研究发展方向.; 胡伟柏文阳瞿裕忠; 关键词：共指消解语义WEB 数据融合

面向新闻语料的中日命名实体翻译抽取被引量：3: 2015年; 命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果.; 尹存燕黄书剑戴新宇陈家骏; 关键词：双语语料

语义Web课程建设初探被引量：2: 2013年; 调研、分析国内外相关课程建设情况,提出语义Web课程的初步建设构想,包括课程定位、教材选择、教学内容及学时分配,并结合南京大学计算机专业开课实例,阐述理论与实践结合、抽象概念与具体应用互补、开展研究性教学等教学模式,从培养学生兴趣入手,基本原理和动手实践并重,提高教学质量。; 胡伟瞿裕忠黄智生; 关键词：语义WEB 语义网本体工程课程建设

语义网的主要功能及其在数字图书馆中的应用被引量：3: 2014年; 语义网自诞生以来，其发展过程—直处于不断的调整变化中，新的语义网标准规范不断推出，其功能和应用也不断向深度和广度扩展。文章首先对语义网的诞生与发展过程进行了回顾与分析，然后通过对语义网应用的调研归纳总结出语义网的主要功能，最后对语义网功能在数字图书馆中的应用进行了分析与阐述。; 欧石燕胡珊; 关键词：语义网

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家社会科学基金(11AZD121)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家社会科学基金(11AZD121)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈