钱力
- 作品数:100 被引量:623H指数:14
- 供职机构:中国科学院文献情报中心更多>>
- 发文基金:国家社会科学基金国家科技支撑计划国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术经济管理医药卫生更多>>
- 科技情报智慧数据:方法、体系与应用被引量:3
- 2024年
- [目的/意义]分析智慧数据建设现状,认识人工智能时代科技情报智慧数据建设的方法与框架。[方法/过程]界定科技情报智慧数据的概念内涵,提出“明确定位与价值、数据架构体系、建设知识语料、数据质量控制、嵌入业务流程的协同建设模式、数据权益约束及安全分级”7个方面的建设原则,设计“技术与功能逻辑、数据分类组织、数据建设流程、数据协同加工工具、运营服务策略”体系框架,拓展智慧数据的示范应用。[结果/结论]通过研发具有“收、存、治、管、用”一体化的科情数据平台,建立了覆盖“情报动态、科研成果、创新活动、创新主体及多类功能型知识实体”等类型的科技情报智慧数据中心,并在“科技人才自动发现、重大科技问题的自动生成以及语义查重查新”等场景中开展应用。
- 钱力刘细文刘细文常志军张智雄李杰刘峥丁洁兰李欣刘峥谢子纯
- 关键词:科技情报人工智能
- 科技情报智慧数据治理技术体系研究与应用实践被引量:1
- 2024年
- [目的/意义]科技情报的智能化发展给数据治理带来了新的挑战,研究数据治理中数据建设内容不成体系、数据建设和业务缺少协同纽带、数据质量差等关键问题,推进数智驱动情报分析新模式的形成。[方法/过程]基于智慧数据内容层级结构,设计了基础治理与协同治理相辅相成的整体架构,分别面向通用化数据处理和定制化数据处理。结合协同主体和协同机制,探索交互式、低代码协同治理平台的建设路径,并以质量指标为牵引制定数据治理全链条的质量控制模块,最终形成科技情报业务牵引的智慧数据治理技术体系。[结果/结论]该体系指导了中国科学院文献情报中心智慧数据治理工作,设计研发了6套治理工具集,实现了对142项数据资产管理以及约4.6亿篇文献数据的内容治理,并支撑了多个知识服务系统的运行。[局限]该治理体系未研究对图片、音频、视频等多模态数据的治理方案。
- 常志军张智雄钱力钱力丁洁兰
- 关键词:协同治理数据质量人工智能
- 面向TRIZ的专利技术三元组抽取研究与应用
- 2024年
- 【目的】针对专利技术三元组自动抽取的准确性和效率不高的问题,研究专利技术三元组抽取的模型,以提升个性化、细粒度、多维度的深度抽取与语义关联的准确性。【方法】针对技术问题、解决方案、技术功能与技术效果等4个技术主题维度,提出基于WeakLabel-Bert-BiGRU-CRF模型的抽取方法,使用宏平均等指标进行模型评估。【结果】选择石墨烯能量存储应用领域专利作为数据集,实验结果表明,相比于Bert-BiGRU-CRF模型,所提模型针对三元组抽取的宏平均超过0.8,进一步减轻了数据标注的工作量,抽取效果更好。【局限】所提模型需要领域专家和专利情报分析人员共同参与数据标注,标注质量的不同会对应用效果产生影响。【结论】基于WeakLabel-Bert-BiGRU-CRF模型,研建对应的原型系统,以便后续进一步使用与推广专利技术三元组抽取方法,在科技文献知识挖掘领域也有较广泛的应用前景。
- 刘春江李姝影方曙胡正银钱力
- 关键词:TRIZ
- 科技情报智慧数据服务体系建设研究被引量:2
- 2024年
- [目的/意义]在数据驱动环境下,科技情报工作愈加重视基于数据的循证分析,建设智慧数据服务体系是科技情报工作向数据驱动赋能转型的重要动力。[方法/过程]界定了智慧数据服务的概念内涵与外延,从数据视角与服务视角两个维度出发阐述了智慧数据服务的特点,论述了科技情报智慧数据服务体系的建设目标;以此为基础,依据从数据到情报的服务逻辑与层级,提出了科技情报智慧数据服务体系的内容架构与建设模式。[结果/结论]从数据供给站、数据超市、数据应用产品、数据服务中台4个方面构建科技情报智慧数据服务体系,前两者侧重数据供给型服务,旨在满足用户的数据型需求,后两者侧重数据感知型服务,旨在满足用户的情报型需求;提出需求与建设并行、治理与协同并行、技术与内容并行、质控与运营并行的“四个并行”建设模式;并以中国科学院文献情报中心的智慧数据服务体系建设为案例,阐述了智慧数据服务体系的应用落地。
- 丁洁兰钱力常志军张智雄
- 关键词:科技情报
- 文献情报机构面向智慧数据建设与服务的权益体系设计
- 2024年
- [目的/意义]智慧数据权益体系是指导智慧数据建设与服务的原则规范,能够为文献情报机构履行社会职责提供更多公共空间。[方法/过程]全面分析了在信息社会环境下智慧数据权益体系的提出背景,深入研究了智慧数据权益体系的研究内容与重要意义,调研提炼了文献情报机构在智慧数据建设与服务过程中商业、开放、合作和自建数据权益面临的现实需求和主要问题。[结果/结论]明确智慧数据权益体系的内涵和基本原则,并制定基于智慧数据建设与服务全流程的制度框架,形成智慧数据权益体系。
- 赵昆华李欣章岑钱力
- 关键词:文献情报机构
- 语义仓储构建技术研究进展被引量:1
- 2013年
- 如何对海量的RDF数据进行存储、查询、存取和推理是RDF数据管理研究领域最关心的问题之一,文章界定了语义仓储的概念及其与关系数据库管理系统的区别,根据语义存储介质和组织方式的不同对语义仓储进行了分类,结合实际的案例对基于内存、基于传统数据库和原生方式存储模式的语义仓储的优缺点、适用范围和不同存储模式之间的区别和联系进行了分析,在语义仓储的分布式存储策略上,对集中式语义仓储和自组织语义仓储这两种网络结构的组织形式和应用系统做了综述,还对语义仓储测试基准及应用系统的研究进展进行了分析,讨论存在的问题及未来可能的研究方向。
- 邹益民张智雄钱力王颖
- 关键词:存储模式
- 半监督的网络科技信息分类模型
- 2014年
- 【目的】开放的网络科技信息网页内容之间区分度较小,传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求。【方法】通过深入分析网络科技信息主题网页的内容和结构,利用开放本体等资源实现领域特征的学习,构建半监督的网络科技信息分类模型。【结果】实验结果表明提出的方法在网络科技信息分类实验中的精度、召回率和F1值分别达到0.9016、0.8756和0.8884,相比贝叶斯方法具有明显优势。【局限】该方法在应用到其他类别的网络科技信息分类时,仍然需要领域专家提供相关领域的核心种子特征。【结论】该方法可以满足网络科技信息深度加工的需求,实现有效的网络科技信息网页分类。
- 李传席张智雄刘建华钱力
- 一种面向科技论文的多任务信息抽取方法及系统
- 本发明提供了一种面向科技论文的多任务信息抽取方法及系统,涉及要素抽取技术领域,该方法包括:采集用于进行要素抽取的论文训练集和待进行要素抽取的论文集,并构建基本语言模型;构建基本类型查询语句,并结合基本论文语句作为输入,以...
- 胡懋地钱力常志军于倩倩张智雄刘细文
- 融入开放科学生态的高端交流平台建设被引量:9
- 2021年
- 再次思考国家高端交流平台的内涵,并探讨其与推进开放科学的关联,为建设平台提供工作思路。从中国科学院使命理解高端交流平台内涵,从全球开放科学发展态势理解高端交流平台建设机制,基于中国科学院文献情报中心“十四五”规划的高端交流平台建设任务,把覆盖全球高质量开放论文、建立集智学术社区、打造国家前沿领域预印本平台、研制开放与高质量的学术信息评价体系这4个建设内容进一步融入开放科学场景,打造开放科学创新平台,初步实现开放科学平台、开放交流功能、开放科学知识社区,以推进开放科学发展。
- 黄金霞王昉王昉钱力姜恩波
- 一种学术画像模型的构建方法及装置
- 本发明公开了一种学术画像模型的构建方法及装置,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,进而建立多级科研用户学术画像模型的用户原始数据层;...
- 谢靖孔贝贝钱力师洪波
- 文献传递