科技基础性工作专项(2013FY110900)
- 作品数:51 被引量:322H指数:12
- 相关作者:诸云强孙凯宋佳侯志伟罗侃更多>>
- 相关机构:中国科学院中国科学院大学山东理工大学更多>>
- 发文基金:科技基础性工作专项国家自然科学基金国家科技基础条件平台建设计划更多>>
- 相关领域:天文地球文化科学自动化与计算机技术经济管理更多>>
- 科学大数据集成共享进展及面临的挑战被引量:12
- 2017年
- 科学大数据集成共享既是数据密集型现代科学研究获取数据的重要途径,也是科学数据自身价值发掘和提升的必然选择,更是国家政策的顶层要求。在分析科学大数据内涵和特征的基础上,总结科学数据集成共享主要进展,指出科学大数据集成共享面临整合集成机制、集成共享质量控制、关联集成与语义搜索、数据产权与共享安全、数据高效利用等5个方面的问题并分别提出应对策略。
- 诸云强潘鹏潘鹏孙凯石蕾孙凯
- 关键词:数据共享数据质量
- 科技基础性工作数据资料的汇交与整编被引量:8
- 2017年
- 国家科技计划项目数据资料汇交与规范化整编对于促进数据的开放共享,发挥数据资源的最大价值,实现国家科技投入的最大效益具有重要意义。科技基础性工作专项是国家科技计划的重要组成部分,其数据资料尚未得到有效的汇交与规范化整编。基于此,本文首先研究科技基础性工作专项项目数据资料汇交与规范化整编的总体流程,然后论述了数据汇交和规范化整编的具体内容和实施步骤,最后开展了数据资料汇交与规范化整编实践。本文的研究思路对于国家各级科技计划项目数据资料的汇交与规范化整编具有重要的参考意义。
- 诸云强孙凯孙凯王筱萱杨雅萍朱华忠乐夏芳朱华忠宋佳彭克银何明跃陈佑启彭克银付磊杨彦臣杨眉邹金秋陈艳李金斌刘燕张金区
- 关键词:科技基础性工作汇交数据共享
- 时间本体及其在地学数据检索中的应用被引量:25
- 2015年
- 高效、准确地获取目标数据及其关联数据,是决定大数据共享与挖掘分析能否实现的关键因素。传统的数据检索方法无法利用地学数据间的显性或隐含关系,已不能满足日益增长的对检索结果质和量的需求,而本体理论和技术的语义检索成为当前的研究热点。本文针对时间这一地学数据的本质属性,在系统研究地学数据时间概念与特征的基础上,建立了地学数据时间本体模型,并深入论述了模型中的时间关系、时间坐标系等内容,提出了时间位置和时间距离的描述函数,同时研究了二者的本体表达方式。构建了包括地质年代等在内的地学数据时间本体库,并以语义网开发框架Jena为基础,经本体解析、元数据时间信息抽取与标注等过程,将时间本体应用于地球系统科学数据共享平台的元数据检索之中。结果表明,以时间本体的地学数据语义检索查全率约为关键字方法的1倍,检索结果排序,以及关联数据推荐方面也有更好的效果,为促进地学数据共享与关联发现提供了一种有效的方法。
- 侯志伟诸云强高星潘鹏罗侃王东旭
- 关键词:地学数据语义检索
- 地学数据本体支持下的科学数据集成方法被引量:2
- 2017年
- 科学数据的语义异构是数据集成共享的主要瓶颈。数据本体是解决数据语义异构的有效方法。首先在系统分析地学数据特征的基础上,提出地学数据本体的总体架构,重点研究地学数据本质内容本体和形态本体,并构建了地学数据本体库。进一步结合科学数据集成的需求,提出基于地学数据本体的数据集成总体流程。在此基础上,以科技基础性工作专项产出的科学数据为例,开展地学数据本体支持下的科学数据集成方法应用研究,证明本方法的可行性和有效性。
- 孙凯贾萍贾萍诸云强诸云强侯志伟王筱萱
- 关键词:语义异构科学数据数据集成映射关系
- 基本比例尺地形图瓦片生产中的接边研究被引量:1
- 2014年
- 通过分析基本比例尺地形图瓦片生产中的接边特点和Global Mapper应用方式,对数字化接边检查方式进行了研究,并阐述了实现原理,总结了完整的检查方案。经试验验证,该方式适用于大规模接边和查图,将无纸化办公在制图领域进行了扩展。
- 霍超刘颖真史克农范承啸
- 关键词:GLOBALMAPPER
- 地理空间模型自动数据匹配结果精准表达方法被引量:6
- 2018年
- 随着现代地学研究的深入与交叉融合,地理空间模型变得日益复杂,需要的输入数据也越来越多。为了快速、高效准备输入数据,一种有效的方法就是为模型自动匹配网络上已经共享的数据。在此背景下,本文针对不完全匹配数据需要自动转换处理的需求,开展了匹配结果精准表达方法研究。首先分析了自动数据匹配流程,在此基础上,提出了匹配结果精准表达结构及其形式化方法。匹配结果包含数据内容、空间和时间3个本质特征项,以及数据类型、格式和结构等形态特征项,每个特征项通过基于XML的相似度、匹配关系、匹配范围分别对共享数据与模型输入数据是否一致、差异在哪、差异有多大等问题进行精准的形式化表达。如果某一数据特征项相似度为1或本质特征项相似度为0时,意味着该特征项完全满足或完全不满足模型的需求,则没有必要进一步精准表达匹配结果;否则需要按上述方法对该数据特征项的匹配结果进行精准的形式化表达。湖南省2010年土壤生产潜力计算实践表明,本文方法可以为后继数据处理服务的自动组合及其数据的自动处理,以及最终向模型推荐完全符合需求的数据奠定基础。
- 杨杰诸云强宋佳宋佳孙凯陆锋
- 关键词:数据共享语义关系
- 面向空间大数据的分布式存储策略被引量:7
- 2019年
- 云计算、物联网、互联网等的发展使社会进入了大数据时代,空间大数据是大数据的主体数据集之一,在国民经济和社会各领域应用广泛。空间大数据要发挥价值就需要在数据共享上做出突破,因此将空间大数据进行有效存储和管理是数据共享及利用所目前面临的问题。通过分析比较目前大数据存储的主要技术,提出了一种基于iSCSI技术的分布式数据库和分布式文件系统相结合的空间大数据存储策略。采用iSCSI技术构建分布式Oracel RAC,完成对空间大数据中的矢量数据、影像和其他数据索引的存储。结合工作实践将这种存储策略应用到空间大数据管理中,验证了该策略的可靠性和可行性,对空间大数据的管理及应用有一定的参考价值。
- 唐桂文韩嘉福李洪省
- 关键词:分布式文件系统分布式数据库
- 我国科学数据DOI应用现状、问题与对策被引量:3
- 2014年
- DOI的应用已经从期刊、电子书、技术报告、标准等文献的标识向与文献相关的科学数据、版权甚至作者的标识等多元化方向发展,并成为知识链接发展的一个重要阶段。本文系统分析科学数据DOI在我国的应用现状,结合科学数据资源的特征,分析科学数据DOI安全与权益、多重解析、粒度与更新、数据引用和出版等问题,并以全球变化科学数据出版系统为例,针对上述问题,给出具体的对策。
- 刘润达诸云强刘闯吴立宗
- 关键词:数字对象标识符DOI科学数据科学数据共享数据中心
- 不同时间尺度、季节的气温数据空间平稳特征及其对插值结果的影响被引量:8
- 2015年
- 不同时间尺度、季节的气温数据表现出不同的空间平稳特征。为探讨分析空间平稳性对气温插值的影响规律,采用趋势线法对气温数据进行空间平稳性探索,并对比分析不同空间平稳性条件下,普通线性回归、普通克里格、回归克里格的气温插值精度及插值结果的空间分布特点。结果显示:冬季日均、月均气温与年均气温呈现空间非平稳,插值精度随时间序列的增长而提高,随着气温数据逐渐趋于稳定,精度提高的幅度逐渐下降;夏季日均、月均气温呈现空间平稳,随时间序列的增长,插值精度的提高并不显著;夏季日均气温各插值方法的插值精度普遍高于冬季日均气温。与普通克里格相比,回归克里格能有效提高空间非平稳数据的插值精度。时间序列的增长削弱了不同插值算法之间的插值精度差异和插值结果空间分布差异。
- 郭春霞诸云强孙伟
- 关键词:气温空间插值
- 地理数据空间本体构建及其在数据检索中的应用被引量:41
- 2016年
- 随着新地理信息时代的来临,地理数据已经呈现出爆炸式增长的趋势。如何在海量的地理数据中准确、及时地找到人们所需要的数据,并把相关联的数据智能地推荐给用户,成为亟待解决的一大难题。针对传统以关键词、主题词等字符串匹配为核心的数据发现方法存在的查不全、查不准的问题,本文通过对地理空间中的概念、属性、关系、规则,以及相应实例的详细表达,初步提出了地理空间本体构建框架,并在此基础上构建了较为完整的地理数据空间本体,以实现地理数据的智能关联,最后在地球系统科学数据共享平台中进行应用实践。结果表明,引入地理数据空间本体后,检索的结果在数据的查全和查准方面显著提高,而且还能智能推荐相关联的数据信息。本文构建的地理数据空间本体对于大数据时代背景下地理数据的精确发现和共享有重要意义。
- 王东旭诸云强潘鹏罗侃侯志伟
- 关键词:地理数据数据检索数据共享