李成赞 作品数:20 被引量:67 H指数:5 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家自然科学基金 国家科技基础条件平台建设计划 中国科学院战略性先导科技专项 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 更多>>
科学数据管理与共享工具及技术研究 本文从传统数据库管理工具、云数据管理解决方案等角度梳理并分析了数据管理工具与技术,并对OData,GData,239.50,OAI-PMH以及Linked Data等主流互操作协议和技术进行比较与分析,总结各数据库互操作... 苏贤明 沈志宏 李成赞 何星关键词:科学数据库 资源管理 信息共享 异构数据源 互操作 文献传递 基于引文网络社区发现的数据推荐研究 被引量:8 2021年 科学数据是科研活动的输入和产出,是科技创新的核心驱动要素。科学数据只有开放共享、广泛传播才能使其价值最大化,然而当前数据出版物的利用率和传播效率整体偏低。为了加速科学数据的传播和重用,提升科学数据的开放共享成效,本文提出了一种基于引文网络社区发现的数据推荐方法。该方法在构建“数据集-论文-作者”之间关联网络的基础上,利用Louvain算法,从合著、共引和耦合三种关联方式分别进行社区发现,然后结合TF-IDF(term frequency-inverse document frequency)及余弦相似度算法,计算数据集与学术论文的相似性,并以此构建数据集与论文所在社区之间的关联,并进行数据集推荐。实验结果证明,基于引文网络社区发现的数据推荐方法,能够有效地发现对数据集潜在感兴趣的论文或作者。同时,发现在数据推荐效果的贡献度和稳定性方面,基于耦合关系的社区发现表现最优,合著关系次之,而引用关系则受出版时间长短和被引次数的影响导致推荐效果差异较大。 李成赞 黎建辉 黎建辉 王学志 沈志宏关键词:引文网络 面向共享的数据存储平台安全体系建设——科学数据银行的建设实践 2024年 开放科学数据是开放科学中的必要组成部分,平衡科学数据的开放共享与安全防护是开放数据实践中面临的重要问题。科学数据存储库作为数据共享主要的承载平台,在确保开放共享中的数据安全等关键问题上,发挥着重要作用。本研究通过ScienceDB的具体业务场景分析,构建了面向通用型数据存储库科学数据银行的数据安全治理体系框架。该框架在信息系统安全等级保护基本要求(三级)的基础上,重点在安全组织制度、资源安全管理、环境安全管理三个维度展开了设计和建设。研究总结了科学数据银行安全体系建设成效,从顶层布局到建设实践层面,对数据存储库的安全建设提出建设建议。 姜璐璐 王鹏尧 李宗闻 李成赞 廖方宇 周园春关键词:数据安全 基于知识图谱和主题模型的短文本特征增强方法 被引量:1 2023年 【目的】中文短文本具有特征稀疏的问题,构建高质量的短文本特征表示将对文本的分类、推荐等处理具有重要意义。【方法】针对这一问题,本文提出了一种基于知识图谱和主题模型的短文本特征增强模型,借助知识图谱获取外部知识对短文本进行特征扩展,使用主题模型对短文本进行语义挖掘,最后通过向量拼接生成短文本特征增强向量。【结论】本文将提出的方法应用到中文短文本分类任务中,并进行了对比实验,实验结果证明本文提出的方法能够更好地对短文本进行特征表示。 许淞源 李成赞 刘峰关键词:主题模型 知识图谱 科学数据出版探索与实践 随着信息技术的快速发展,数据已成为重要的战略资源,科学研究需要一种开放的模式.互联网技术的发展为期刊的出版带来了新的可能,通过互联网来实现快速传播,突破了对纸媒的依赖,使得期刊新模式成为可能.本文基于数据出版模式进行了探... 姜璐璐 孔丽华 李成赞关键词:云服务 科学数据出版云服务探索与实践 科学数据是重要的战略性科技资源科学数据是信息时代传播速度最快、影响面最宽、开发利用潜力最大的战略性、基础出性科技资源科学数据受到世界各国高度重视,科学数据应用分析能力已经成为国家的核心竞争力和发展驱动要素随着大数据时代的... 李成赞关键词:出版工作 科学数据 科学数据出版调查与分析 被引量:9 2016年 现代科学活动对数据的依赖日益增强,这使得推动科学数据开放共享逐渐成为现代科学研究的必然诉求。然而科学数据共享实践仍存在诸多障碍。为了更好地协调科学数据开放共享相关利益者的权益分配、减少数据开放的阻力,科学数据出版提供了一种积极的模式探索。立足现代科研活动背景,本文面向在ESSD、ESA、GBIF、DRYAD、PANGAEN等机构发表数据论文的上千名作者展开数据出版调查。本调查于2014年8月至12月进行,重点围绕数据出版动力、数据出版方式、数据出版运营模式以及数据出版质量评价展开。调查结果显示,数据出版作为推动科学数据共享的途径之一,已获得较广泛共识。当前数据出版发展初具规模并进入快速上升期。与传统出版相比,数据出版在树立学术地位和行业认可度等方面还有待提升。运营模式尚不成熟,数据权益保护、运营机制等仍是数据共享的关注焦点。数据引用评价源于传统学术体系又有所不同,亟待建立一套高效合理的质量控制与评价激励机制。 黎建辉 吴超 张丽丽 李成赞 胡良霖关键词:科学数据 数据共享 面向科学数据的搜索引擎voovle 被引量:2 2011年 科学研究产生的科学数据资源日益激增,仅在中国科学院科学数据库"十一五"信息化建设中整合全院科学数据库形成的共享数据量就多达148TB。为了充分发挥这些共享科学数据的价值,结合科学数据的专业特点,提供一套跨库统一检索、不同领域科学资源关联及发现的搜索工具,具有重要的实用价值。本文阐述面向科学数据搜索引擎voovle提出的背景、面临的问题,重点介绍了voovle的功能与实现,详述元数据模型等几项关键技术。最后通过案例介绍了voovle目前的应用情况、存在的不足以及下一步的发展方向等。 李成赞 沈志宏 黎建辉关键词:科学数据 元数据 语义 关联数据 基于区块链的农业科学数据溯源应用初探 被引量:3 2020年 农业科学数据是农业科学研究得以持续发展和科学技术不断创新的宝贵资源。农业科学数据溯源目的是为了实现数据的追溯,确保单个溯源记录真实性及记录顺序不会被修改。而区块链具备数据的防篡改、可追溯特性,两者的结合对于农业科学数据溯源具有重要作用。科学数据标识技术将在互联网环境下为科学数据提供便利的访问途径,确保数据溯源信息互联互通,实现对数据全生命周期的跟踪与溯源。针对农业科学数据溯源和标识问题,本文提出了基于区块链的农业科学数据溯源应用方案,通过区块链技术记录数据集的变化和演变过程,在数据使用过程中,可以根据溯源链通过数据标识解析技术对科学数据进行快速寻址定位,并利用科学数据的签名信息检验数据集是否正确。农业科学数据集溯源信息存储到区块链上后,其他节点可从区块链上获取溯源对象的记录信息,进行溯源数据的真实性验证,为广泛的研究人员提供有效地共享和验证科学数据的解决方案。最后本文通过使用科学数据存储库中数据集更新及版本变化过程记录进行了试验验证。 王姝 孙善鹏 樊景超 樊景超 郭志斌 郭志斌 李成赞 李成赞 周园春关键词:区块链 科学数据 全球科学数据出版发展态势分析--基于Web of Science数据库的调研 被引量:12 2021年 科学数据出版是推动科学数据共享,实现科学数据价值最大化的重要方式。本文通过对全球科学数据出版数据进行分析,探求全球科学数据出版发展态势。对Web of Science数据库中的数据论文和数据集记录进行检索,通过数据统计方法从时间、国家/地区、研究方向、出版来源、影响力等维度进行分析。从时间维度看,科学数据出版整体呈现蓬勃发展的态势。国家/地区维度上,美国处于领先地位,中国虽然取得巨大成就,但与美国依旧存在巨大差距。研究方向维度上,科学数据出版在自然科学、社会科学等研究领域均具有重要的科学价值。出版来源维度上,中国虽然科学数据出版数量领先,但科研人员更倾向于选择国外出版物、存储平台进行数据发布。影响力维度上,中国科学数据的影响力与欧美国家存在一定差距。 王卫军 李成赞 郑晓欢 郑晓欢 褚大伟 陈昕 陈昕 杜一关键词:科学数据 数据集