王燕鹏 作品数:26 被引量:163 H指数:8 供职机构: 中国科学院文献情报中心 更多>> 发文基金: 国家创新方法工作专项 国家自然科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 环境科学与工程 更多>>
基于候选技术辅助生成和多源数据评估的颠覆性技术识别方法研究 被引量:4 2023年 [目的/意义]数据驱动的颠覆性技术识别工作的两个难点问题在于:如何准确地获得领域候选颠覆性技术,如何全面有效地评估候选技术的颠覆性潜力。针对这两个问题,提出一种基于候选技术辅助生成和多源数据评估的颠覆性技术识别方法,为颠覆性技术识别工作的开展提供新思路。[方法/过程]针对候选技术获取问题,提出了一种候选技术辅助生成方法,通过词性标注和Head-matching的方法自动构建领域技术层次结构体系,然后结合专家知识判断确定候选颠覆性技术;针对颠覆性潜力评估问题,基于表征“科学—技术—产业—市场”链条的多源数据,界定了两类颠覆性技术,分别是“研究储备高—技术成果多—产业规模大—公众关注高”的潜力型颠覆性技术和“研究储备高—技术成果少—产业规模小—公众关注低”的潜伏型颠覆性技术,并通过计算颠覆性潜力值(DPV)和颠覆性潜伏度(DLV)指标来评估候选技术的颠覆性潜力。[结果/结论]通过在材料领域应用本方法发现,评估得到的DPV较高的3项潜力型颠覆性技术(以石墨烯为代表的二维材料、先进半导体材料和增材制造材料技术)和DLV较高的3项潜伏型颠覆性技术(材料基因组、智能材料和超材料技术)覆盖了专家咨询确定的验证集中的6项技术,证明了本方法的有效性。[局限]技术层次体系自动构建方法适用于头名词特征比较明显的技术领域,技术颠覆性潜力评估采用的多源数据需要结合颠覆性技术本质特征进一步深化扩展。 吕璐成 赵萍 姜山 王燕鹏 张迪 张迪 王学昭 刘细文关键词:多源数据 美国出口管制科学仪器技术分类研究 被引量:8 2022年 在中美贸易冲突的背景下,美国为首的发达国家以立法形式限制关键核心技术向我国出口,美国出台的《商业管制清单》等文件包含了大量对技术、设备和产品的出口限制,涉及重要的科学仪器及其相关的零部件。本文以美国“两用”物品的商业管制清单(The Commerce Control List,CCL)为分析对象,以中国科学仪器分类为标准,将CCL中的内容与国内科学仪器的分类进行对比。通过对CCL的计量分析,揭示发现中国科学仪器领域相关技术受美国管制的形势非常严峻,有42.08%的清单条款涉及对科学仪器的管制。在十二个科学仪器的分类中,分析仪器、工艺实验设备、电子测量仪器等是受管制范围较广的领域,激光器、核仪器是传统受到管制的领域,医学诊断仪器、大气探测仪器等受管制范围较小。在分析的基础上为我国科学仪器的发展提出了分类应对、坚定走自主研发道路等建议。 陈芳 王学昭 刘细文 刘细文 吴鸣关键词:科学仪器 文本挖掘 自然语言处理 科学计量方法在科技政策研究中应用的实证研究 被引量:8 2017年 [目的 /意义]旨在研究科学计量方法在科技政策研究中的应用程度和范围。[方法 /过程]对科学计量领域与科技政策领域的实证数据集进行关键词分析,设计二维词频分析框架,并在此基础上通过聚类分析揭示不同类型的计量与政策研究相结合的主题。[结果 /结论]数据结论显示:科学计量方法在科学政策研究中的应用主要是在宏观层面,而在微观问题层面应用相对较少;一些利用科学计量方法研究的政策问题并非是科技政策领域的研究热点或核心。这种情形与科学计量学的学科特点与使用局限性有一定的关系,但如何恰当扩展和深化科学计量方法在科技政策领域的应用,以解决科技政策中的具体问题、更好地支撑科技管理与科技决策,需要引起关注。 丁洁兰 刘细文 刘细文 杨立英 翟琰琦关键词:科学计量学 聚类分析 DIKIW逻辑链下GPT大模型对文献情报工作的潜在影响分析 2023年 [目的/意义]以ChatGPT为代表的GPT类生成式大模型发展日益蓬勃,引起学界和业界的广泛讨论,同时也对文献情报工作产生了潜在的难以估量的影响。以DIKIW逻辑链为指导框架,研究GPT大模型对文献情报工作的潜在影响。[方法/过程]以DIKIW为主线,梳理全数字化文献情报工作概念框架;在此框架下分析、评估GPT类大模型对文献情报工作的影响,并构想GPT影响下的文献情报工作流程。[结果/结论]研究认为,GPT类大模型对文献情报工作的本质影响是打通DIKIW链条中的“数据→信息→知识”部分,即原本“将原始数据加工为信息、进而增值为知识”的人工操作步骤,将由GPT类大模型在内的AI工具链条式完成。因此,文献情报工作需要从“大规模加工机器可读可理解的数据”“大规模集成情报开源模型”等方面进行突破改进,才能更好地支撑场景驱动的智慧化情报服务工作。 刘细文 孙蒙鸽 王茜 王茜 王燕鹏 郑新曼关键词:GPT 场景化智慧数据驱动的情报研究模式:概念、技术框架和实验验证 被引量:10 2023年 【目的】提出场景化智慧数据驱动的情报研究模式,并通过若干实例进行初步验证。【方法】建立“科技决策需求场景(S)-场景化数据(D_(X))-解决方案场景(S)”的量化表征模型(SDS),通过科技决策需求场景化、场景化数据建设、可选解决方案生成三个步骤实现场景化智慧数据驱动的情报研究。【结果】该研究模型的两个应用案例支撑了新兴和颠覆性技术遴选、科技前沿态势感知、科研项目选题评估、俄乌冲突态势感知等具体决策场景和问题,得到相关科技决策者和管理者的认可。【局限】囿于现有智能技术的准度和精度,数据场景化过程的自动化程度、证据链形成过程中智能技术与情报基础理论方法结合深度有待提高。【结论】场景化智慧数据驱动的情报研究模式促进了情报结论的广度和深度升级,实现了情报工作的效率和速度升级,验证了场景化智慧数据的可复用性和可移植性,可为未来面向科技决策的情报研究和服务提供理念思想和实施路径的参考和借鉴。 王学昭 王燕鹏 王燕鹏 陈芳 赵萍关键词:证据链 基于WOS的中美医学信息学研究热点对比分析 被引量:7 2016年 以Web of Science(WOS)核心合集为数据源,检索中、美两国近10年在医学信息学领域发表的文献,采用共词分析方法与TDA软件和SPSS 20.0软件对数据进行清理和聚类分析,并通过Ucinet和Net Draw对关键词的分布进行可视化分析,总结两国在医学信息学领域的研究热点。经聚类和可视化分析发现,两国医学信息学研究既存在一致性也存在差异性,一致性表现在计算机技术在医院管理和临床诊疗中的应用,差异性表现在美国医学信息学科整体发展水平较高、对医学信息和数据的利用更为充分、医学信息学教育体系更为完善、循证医学研究水平及层次较高。 王燕鹏关键词:医学信息学 共词分析 聚类分析 社会网络分析 可视化分析 机器学习全球专利计量分析 2021年 机器学习技术是当前人工智能领域受关注度最高的技术之一。该文面向揭示机器学习技术布局现状和竞争格局的目标,基于全球范围内2000年以来布局的机器学习专利数据,从整体技术和典型分支技术两个层面,从专利申请趋势、有效专利持有、近3年专利布局以及四方专利布局等角度,对机器学习技术的专利布局进行分析。研究发现:全球机器学习技术专利申请整体呈现增长态势。我国的机器学习专利申请已经建立一定优势,但是专利布局主要围绕本国保护,在海外专利布局方面距离美国、日本、韩国等国家还有一定差距。 吕璐成 张博 王燕鹏 赵亚娟 钱力 厉曈曈关键词:人工智能 AI芯片专利技术研发态势 被引量:7 2021年 近年来,人工智能在基础研究、技术研发和产业应用方面均取得了快速发展,也对计算芯片提出了新的需求和挑战。深度学习算法需对海量数据进行训练,对大规模并行计算能力有很高的要求,而传统计算架构无法支撑大规模计算需求,因此新架构的AI芯片得以迅速发展。文章以专利文献为分析对象,从专利态势、专利来源国/地区、专利申请人、高价值专利四个角度对AI芯片及GPU、FPGA、CPLD等分支领域专利进行分析,揭示全球AI芯片专利技术布局态势和竞争格局,以期为我国人工智能及AI芯片技术研发布局提供情报参考和支撑。 王燕鹏 吕璐成 张博 赵亚娟 钱力关键词:GPU FPGA CPLD 专利计量情报问答系统研究与实践 被引量:2 2019年 面向科技情报机构对于高效、实时、精准、智能科技情报服务方式和产品的需求,针对专利计量分析服务,开展专利计量情报问答系统的研究和实践。研究对专利计量情报问答系统的概念进行了界定,基于自然语言理解和自然语言生成技术,提出了以问句理解模块和答句生成模块为核心的专利计量情报问答系统实现技术方案。研究设计并实现了人工智能领域专利计量情报问答系统,能够应对同一问题的多种问法给出正确答案,对科技情报机构提升科技情报服务质量和用户体验具有积极意义。 吕璐成 韩涛 王燕鹏关键词:问答系统 计算机视觉全球专利计量分析 2021年 计算机视觉技术是人工智能领域最热门的研究领域之一。该文面向揭示计算机视觉技术专利布局态势的客观需求,基于全球范围内2000年以来布局的计算机视觉专利数据,从整体技术和典型分支技术两个层面,从全部专利布局情况、有效专利持有情况、近三年专利布局情况以及四方专利布局情况四个角度,对计算机视觉技术专利进行了分析。研究发现:全球计算机视觉技术专利布局整体呈现增长态势,我国在计算机视觉专利上具有明显优势,但是专利布局主要以本国为主,而且在有效专利持有量上不够突出。我国在生物识别技术方面具有一定的优势。 张博 吕璐成 王燕鹏 赵亚娟 钱力关键词:计算机视觉 生物识别