张丽丽 作品数:19 被引量:181 H指数:8 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家自然科学基金 国家科技基础条件平台建设计划 中国科学院战略性先导科技专项 更多>> 相关领域: 文化科学 自动化与计算机技术 天文地球 经济管理 更多>>
《科学数据管理办法》语词分析 被引量:9 2020年 文章分析了《科学数据管理办法》的文本语词,有助于把握国家对科学数据管理的政策导向。文章对《科学数据管理办法》的文本内容进行分词、词频合并、词性筛选、虚词剔除等预处理操作,基于文本预处理结果筛选得出频繁词和热词,构建“语词—条款”共现矩阵并可视化展示。研究发现:《科学数据管理办法》共有11个核心频繁词、9个重点频繁词、8个主要频繁词和若干个一般频繁词,各主题语词在文本中均有对应的核心条款,但主题语词和核心条款分布不均。 温亮明 李洋 张丽丽 黎建辉关键词:自然语言处理 词频统计 云存储对数据资源中心服务的几点启示 追踪数据存储服务最新进展,了解云服务相关理论,立足中国科学院科研用户存储服务需求,试探讨云服务对中国科学院数据资源中心现有工作继续推进的有益性参考。尤其讨论了云存储的安全保障策略、经济策略、合作运营策略及存储服务拓展策略... 张丽丽国内外科学数据管理与开放共享的最新进展 被引量:47 2018年 作为科研活动的灵魂,科学数据既是激发科研创新的起点,也是科研活动丰富成果不可或缺的部分。国内外科学数据管理与共享从"积极温和的科学数据政策导向"和"全面细致的科学数据管理实践"两方面开展。通过对国内外发展现状的比较,笔者认为,国内的科学数据政策宏观体系尚待拓展,政策落实仍需继续积累;仍有很多学科门类需要提高数据管理意识和管理水平;科学研究的整体环境有利于开放科学数据文化的孵化,但仍需多利益相关群体的综合协调。未来,积极温和的共享趋势仍占据主流,科学数据的公、私权力争论愈演愈烈,信息技术变革与科学数据管理边界的再认识将持续推动数据开放。 张丽丽 温亮明 石蕾 郑晓欢 黎建辉关键词:科学数据共享 开放数据 科学大数据开放共享:模式与机制 被引量:29 2017年 文章结合科学大数据开放共享的案例场景,提炼出5种典型的开放共享模式:大科学装置的单源数据共享模式、广域合作驱动的分布式注册模式、基于数据存储库的集中存缴模式、以数据期刊为代表的科学数据出版以及数据集市,并对这些模式进行分析,识别出关键角色及主要共享瓶颈。在此基础上,探讨了数据开放共享激励机制、评价机制、传播机制等关键机制。希望上述研究能够有助于厘清当前科学大数据开放共享的有关现状,并对其未来推进有所裨益。 李成赞 张丽丽 侯艳飞 周园春 黎建辉关键词:数据共享 共享机制 科研信息基础设施的运行治理模式研究 被引量:3 2022年 【目的】科研信息基础设施建设是支持科技创新、社会治理与全球合作的坚实基础,需要配套强有力的治理模式来推进实施。【方法】本研究围绕科研信息基础设施,构建了包括组织模式、服务模式和运营模式在内的三维治理框架,遴选了国内外十余个案例进行比较分析。【结果】科研信息基础设施建设要点包括:组织层,应把握中心化与去中心化组织架构的平衡;服务层,技术的去中心化与纵深生态系统建设值得关注;运营层,需建立动态、完整、开放、效率与公平兼顾的成本与收益计量方法、激励机制。此外,面向开放科学范式的一体化治理体系还需聚焦场景、资源特质,并覆盖科研全生命周期。【结论】资源的开放融合,技术架构的联邦化与互操作,服务场景化、智能化,运营管理安全可信,成为当前科研基础设施发展的重要趋势。良好的治理模式,需综合考量上述各要素,并应伴随技术发展与科研范式的变化而革新。 张丽丽 黎建辉科学数据共享系统的现状与趋势 被引量:11 2019年 数据密集型科研已经成为大数据时代科学发展的新范式,科学数据开放共享已成科技界的普遍共识。在长期实践中,科学数据共享形成了以科学仪器、数据平台、数据出版、众包处理、数据交易等为典型代表的不同模式。与之对应,针对不同的领域和应用场景出现了种类繁多的解决方案,如仓储型、联邦服务型、数据分发型和按需计算与分析云服务型等。本文在对上述四类主流科学数据共享系统的服务内容、技术特征、应用场景与代表性系统分析比较的基础上,提出科学数据共享系统未来发展的的趋势,并以中国科学院战略性科技先导专项"地球大数据科学工程"研发的地球大数据云服务平台为典型案例,进行了深入的剖析。本文认为,未来的科学数据共享系统将围绕着科学数据全生命周期管理的需求,形成具备数据获取、存储、分发共享、计算分析、智能服务等功能于一体的融合型云服务系统,并将实现数据的FAIR化、智能关联和机器可理解,促进数据共享良性生态的形成。 李云婷 温亮明 张丽丽 黎建辉关键词:数据共享 数据融合 科学数据 数据系统 数据论文引用计量规律初探——基于中国数据期刊的案例研究 2024年 数据出版是一种创新数据共享形式。为更好地了解数据出版,本文通过文献综述和案例调研,构建了数据论文计量框架,遴选国内数据期刊《中国科学数据(中英文网络版)》和《全球变化数据学报(中英文)》,揭示两刊数据出版与数据共享情况。统计涵盖两刊论文指标(学科领域、团队规模、资金来源)、数据指标(数据来源、规格与规模、数据曝光)、引证指标(被引、施引、时间)等30余个特征项。结果显示,宏观趋势方面,数据出版成为数据共享的重要途径,并在规范数据质量、汇聚特色主题数据、推进团队合作、争取资金支持等方面具有优势。中观运营层面,国家数据中心为数据出版提供平台保障。微观资源层面,出版数据集兼具学科差异性和跨域共性治理需求。其中,数据曝光、访问引用转化率等指标,为数据可复用性测度提供线索。此外,独立数据出版在我国尚处发展上升期,建议加强数据文化建设、扩展运营模式、提升资源治理能力与平台建设水平,完善技术迭代与激励评价机制等。 张丽丽 惠嘉怡 刘瑞霖关键词:开放数据 数据重用 开放科学云联邦:产生背景、应用架构及关键技术 2022年 云联邦是云服务在新科研范式下的发展方向之一,其核心特征包括云际交互、跨越平台、动态可变、负载扩展、分布共治等,探索开放科学背景下云联邦的发展需求和架构技术对于拓展云服务边界具有重要意义。本文对开放科学云联邦(OSCF)的产生背景、应用架构和关键技术进行了综述。首先分析了开放科学背景下科研基础设施在资源状态、资源供给、资源处理、资源关系、操作方式等方面面临的新需求;其次梳理了开放科学云和云联邦的发展历程,明确了开放科学云联邦发展的必然性;然后归纳了开放科学云联邦的应用场景、应用特点,并提出了逻辑架构;最后从身份认证、节点信任、资源迁移、资源匹配、资源优化5个方面介绍了开放科学云联邦涉及的若干关键技术。 温亮明 李跃鹏 张丽丽 张丽丽关键词:云服务 科研数据的开放:进展、模式与新探索 被引量:19 2016年 明确了科研数据的概念和分类,从原则、政策、技术、配套措施等方面总结了科研数据开放的当前进展,并将科研数据开放主要概括为自上而下的开放模式、横纵联合的开放模式与自下而上的开放模式3类。进一步分析指出,科研数据开放需要在强有力的行政力量支持下,配套更多的激励措施,调动数据拥有者的参与意愿。作为推动研究数据共享的一种有效形式,研究数据出版提供了可行方案,以《中国科学数据》为例,阐释了数据期刊在推动科研数据出版中的积极实践及其战略意义。 张丽丽 黎建辉关键词:科研数据 数据共享 2000-2017年联合国各成员国的SDGs指标对相关性系数数据集 被引量:2 2021年 可持续发展目标(Sustainable Development Goals,SDGs)是联合国用于指导全球可持续性发展工作的新议程。各项目标之间的关联性,尤其是3级指标数据的相关性分析和研究,对于有效推动可持续发展目标的具体实施具有重要意义。本文基于《可持续发展报告2020》中联合国全体193个成员国的2000–2017年的3级指标时间序列数据,经过数据的预处理,并依据算法的相关性覆盖程度的大小,从Pearson、Spearman、Kendall和MIC 4个算法中遴选出MIC算法和Spearman算法,计算得到193个成员国2000–2017年总计62项可利用指标项、1766个指标对的相关系数和相关方向。本数据集可以作为联合国评估可持续发展目标未来实现的分析数据,也可以作为各国监测指标完成情况、制定相关政策的重要参考依据。 高天 张丽丽 黎建辉关键词:时间序列