您的位置: 专家智库 > >

国家社会科学基金(11AZD121)

作品数:11 被引量:37H指数:4
相关作者:柏文阳瞿裕忠胡伟黄书剑陈家骏更多>>
相关机构:南京大学计算机软件新技术国家重点实验室阿姆斯特丹自由大学更多>>
发文基金:国家社会科学基金国家自然科学基金江苏省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 9篇自动化与计算...
  • 2篇文化科学

主题

  • 4篇语义网
  • 3篇本体
  • 2篇语义
  • 2篇语义WEB
  • 2篇数据库
  • 2篇文档
  • 2篇查询
  • 1篇虚拟文档
  • 1篇引擎
  • 1篇引擎实现
  • 1篇映射
  • 1篇正则
  • 1篇正则化
  • 1篇数据划分
  • 1篇数据库模式
  • 1篇数据融合
  • 1篇数字图
  • 1篇数字图书馆
  • 1篇双语语料
  • 1篇图书

机构

  • 9篇南京大学
  • 2篇计算机软件新...
  • 1篇阿姆斯特丹自...

作者

  • 5篇柏文阳
  • 3篇戴新宇
  • 3篇胡伟
  • 3篇陈家骏
  • 3篇瞿裕忠
  • 3篇黄书剑
  • 2篇朱敏
  • 2篇程佳
  • 1篇高磊
  • 1篇贾存鑫
  • 1篇黄智生
  • 1篇欧石燕
  • 1篇胡珊
  • 1篇尹存燕
  • 1篇彭义
  • 1篇徐帅帅

传媒

  • 2篇计算机研究与...
  • 2篇计算机技术与...
  • 1篇模式识别与人...
  • 1篇小型微型计算...
  • 1篇软件学报
  • 1篇中文信息学报
  • 1篇计算机教育
  • 1篇数字图书馆论...
  • 1篇Journa...

年份

  • 1篇2017
  • 2篇2015
  • 3篇2014
  • 2篇2013
  • 3篇2012
11 条 记 录,以下是 1-10
排序方式:
SMap:基于语义的关系数据库模式与OWL本体间映射方法被引量:5
2012年
伴随语义网的发展,语义网本体数量激增.然而万维网上绝大多数的数据仍存储在关系数据库中.建立关系数据库模式与语义网本体间的映射是一种实现两者之间互操作性的有效途径.因此,提出了一种基于语义的关系数据库模式与OWL本体间的映射方法SMap,包含简单映射发现和复杂映射学习两个阶段.在简单映射发现阶段,首先通过逆向工程规则将关系数据库模式和本体中的元素对应地分为不同类别,再为每个元素构建虚拟文档并计算它们之间的相似度,其中针对不同类别的元素设计了不同的虚拟文档抽取方案.在复杂映射学习阶段,基于已发现的简单映射以及重叠的数据库记录和本体实例,自动化地生成训练事实数据,然后运用归纳逻辑编程算法学习出多种类型的基于Horn规则的复杂映射.真实数据集上的实验结果表明,SMap在简单映射发现和复杂映射学习上均明显优于现有的关系数据库模式与本体间映射方法.
贾存鑫胡伟柏文阳瞿裕忠
关键词:本体映射关系数据库虚拟文档归纳逻辑编程
VDoc+:a virtual document based approach for matching large ontologies using MapReduce被引量:4
2012年
Many ontologies have been published on the Semantic Web,to be shared to describe resources.Among them,large ontologies of real-world areas have the scalability problem in presenting semantic technologies such as ontology matching(OM).This either suffers from too long run time or has strong hypotheses on the running environment.To deal with this issue,we propose a three-stage MapReduce-based approach V-Doc+ for matching large ontologies,based on the MapReduce framework and virtual document technique.Specifically,two MapReduce processes are performed in the first stage to extract the textual descriptions of named entities(classes,properties,and instances) and blank nodes,respectively.In the second stage,the extracted descriptions are exchanged with neighbors in Resource Description Framework(RDF) graphs to construct virtual documents.This extraction process also benefits from the MapReduce-based implementation.A word-weight-based partitioning method is proposed in the third stage to conduct parallel similarity calculation using the term frequency-inverse document frequency(TF-IDF) model.Experimental results on two large-scale real datasets and the benchmark testbed from Ontology Alignment Evaluation Initiative(OAEI) are reported,showing that the proposed approach significantly reduces the run time with minor loss in precision and recall.
Hang ZHANGWei HUYu-zhong QU
关键词:MAPREDUCETF-IDF语义网
一种基于HBase的RDF数据存储模型被引量:8
2013年
随着语义网数据的爆炸式增长,如何高效地管理海量RDF数据成为一个关键问题.现有的集中式关系型RDF数据存储管理系统已难以适应这种需求,越来越多的研究者使用分布式系统和并行计算技术来管理海量RDF数据.提出一种基于分布式数据库HBase的RDF数据存储模型,根据OWL本体定义文件,将数据按类划分,同一类的三元组数据保存在该类的S_PO和O_PS两张表中,实现该存储模型上的8种Triple Pattern和Basic Graph Pattern查询算法,并提供部分推理功能,在Hadoop集群环境下对存储模型与查询算法进行了可行性验证.
朱敏程佳柏文阳
关键词:资源描述框架SPARQL查询处理
基于CouchDB的SPARQL查询引擎实现
2014年
传统的SPARQL查询引擎在处理查询时以三元组模式为基本单位做查询优化处理,在三元组模式较多时存在着过多的连接操作,开销比较大。文中基于文档数据库的存储和查询特点,提出一种利用主语分类的方式来存储RDF数据的方法,将不同的RDF三元组按主语分成不同的类,并存入文档数据库的文档中。在处理SPARQL查询时将三元组模式也按照主语分类,构成以主语相关块为单位的查询图,并提出一种基于属性相关性的选择度估计方法来优化查询执行计划。文中利用文档数据库CouchDB实现了新的SPARQL查询引擎,实验证明文中的方法能够提高SPARQL基本图模式查询的效率。
彭义倪传蕾柏文阳
关键词:文档数据库查询优化
语义Web中对象共指的消解研究被引量:7
2012年
随着语义Web的快速发展,语义Web数据大幅增长.在语义Web中,单个对象很可能由多个不同的标识符(例如URI)指称.语义Web中,对象共指的消解是识别语义Web中指称相同对象的不同标识符,并消除描述这些标识符的RDF(resource description framework)数据之间不一致性的过程,它对于语义Web数据的融合、搜索、浏览等具有重要作用.首先,形式化定义了语义Web中对象共指的消解问题;然后,从对象共指识别使用的特征、数据冲突的消解方式、对象共指消解方法的适用范围、现有原型系统和基准测试集这5个方面调研了最新的研究进展;最后,讨论了尚存的挑战,并展望未来可能的研究发展方向.
胡伟柏文阳瞿裕忠
关键词:共指消解语义WEB数据融合
面向新闻语料的中日命名实体翻译抽取被引量:2
2015年
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果.
尹存燕黄书剑戴新宇陈家骏
关键词:双语语料
语义Web课程建设初探被引量:2
2013年
调研、分析国内外相关课程建设情况,提出语义Web课程的初步建设构想,包括课程定位、教材选择、教学内容及学时分配,并结合南京大学计算机专业开课实例,阐述理论与实践结合、抽象概念与具体应用互补、开展研究性教学等教学模式,从培养学生兴趣入手,基本原理和动手实践并重,提高教学质量。
胡伟瞿裕忠黄智生
关键词:语义WEB语义网本体工程课程建设
语义网的主要功能及其在数字图书馆中的应用被引量:2
2014年
语义网自诞生以来,其发展过程—直处于不断的调整变化中,新的语义网标准规范不断推出,其功能和应用也不断向深度和广度扩展。文章首先对语义网的诞生与发展过程进行了回顾与分析,然后通过对语义网应用的调研归纳总结出语义网的主要功能,最后对语义网功能在数字图书馆中的应用进行了分析与阐述。
欧石燕胡珊
关键词:语义网
基于特征选择和点互信息剪枝的产品属性提取方法被引量:3
2015年
产品属性的自动抽取是情感分析中的重要研究内容.文中提出一种基于特征选择和词频及点互信息剪枝的产品属性提取方法.首先引入在分类任务中常用的l1-norm正则化(Lasso)方法,将产品属性抽取问题转换为分类中的特征选择问题,利用Lasso生成稀疏模型的特性,将模型中少量的特征作为产品特征属性候选集.然后根据候选特征属性集中的特征属性在文本中出现的频率进行排序并剪枝.最后经过进一步合并和点互信息剪枝处理,得到最终的产品属性集.在中文产品评论集上的实验证实文中方法的有效性.
高磊戴新宇黄书剑陈家骏
关键词:情感分析
一种基于OWL的语义网数据划分与并行加载方法被引量:2
2014年
随着语义网数据规模的爆炸式增长,海量数据存储和检索面临越来越严峻的挑战,分布式数据库与并行计算已成为其主要解决方案。基于列存储分布式数据库HBase设计了一种多表语义网数据存储模型,实现从OWL本体定义到存储模型的映射。基于OWL本体定义信息对语义网数据实现按类划分,并将三元组存储于主体所属于的类的两张表里,采用MapReduce框架实现并行的数据划分和加载任务,最后在Hadoop集群环境下对方法进行了可行性验证。
程佳朱敏柏文阳
关键词:语义网网络本体语言并行计算
共2页<12>
聚类工具0