您的位置: 专家智库 > >

范云满

作品数:25 被引量:159H指数:6
供职机构:中国医学科学院北京协和医学院医学信息研究所更多>>
发文基金:中国科学院西部之光基金国家自然科学基金中央级公益性科研院所基本科研业务费专项更多>>
相关领域:医药卫生自动化与计算机技术文化科学更多>>

文献类型

  • 19篇期刊文章
  • 4篇会议论文
  • 2篇专利

领域

  • 13篇医药卫生
  • 8篇自动化与计算...
  • 6篇文化科学

主题

  • 5篇大数据
  • 4篇数字资源
  • 3篇医学索引
  • 3篇元数据
  • 3篇生物医学
  • 3篇数据库
  • 3篇数字资源长期...
  • 3篇主题
  • 3篇资源长期保存
  • 3篇西太平洋地区
  • 3篇西太平洋地区...
  • 2篇异构
  • 2篇引文
  • 2篇引文分析
  • 2篇数据存储
  • 2篇数据服务
  • 2篇数据云
  • 2篇中文
  • 2篇主题模型
  • 2篇可视化

机构

  • 20篇中国医学科学...
  • 5篇中国科学院
  • 4篇中国科学院大...
  • 1篇军事医学科学...
  • 1篇中国科学技术...
  • 1篇中国科学院研...
  • 1篇中国科学院文...
  • 1篇中电数据服务...

作者

  • 25篇范云满
  • 14篇方安
  • 7篇胡佳慧
  • 6篇钱庆
  • 6篇马建霞
  • 4篇洪娜
  • 2篇欧阳昭连
  • 2篇王军辉
  • 2篇刘静
  • 1篇杨冠灿
  • 1篇张婷
  • 1篇荆淑芳
  • 1篇陈亮
  • 1篇逯万辉
  • 1篇池慧
  • 1篇高星
  • 1篇白杨
  • 1篇杨林
  • 1篇张静

传媒

  • 5篇医学信息学杂...
  • 2篇图书情报工作
  • 2篇现代图书情报...
  • 2篇中华医学图书...
  • 2篇中华医学会第...
  • 1篇情报科学
  • 1篇情报杂志
  • 1篇图书馆理论与...
  • 1篇情报学报
  • 1篇中国新药杂志
  • 1篇中国药业
  • 1篇数字图书馆论...
  • 1篇中国数字医学
  • 1篇中国医学科学...

年份

  • 2篇2022
  • 3篇2021
  • 2篇2020
  • 3篇2019
  • 1篇2018
  • 3篇2017
  • 3篇2015
  • 4篇2014
  • 3篇2013
  • 1篇2012
25 条 记 录,以下是 1-10
排序方式:
面向技术演化分析的多主路径方法研究被引量:34
2015年
[目的/意义]基于当前技术演化分析方法的发展现状,提出一种能够在微观层次上突出既定领域中主要技术发展脉络的多主路径方法。[方法/过程]将专利文本挖掘和动态规划方法应用于专利引文网络,以路径上所有专利对的语义相似度总和最优作为启发策略进行路径搜索,以获取若干能够分别聚焦于特定主题的主路径,供研究者总览既定技术领域中主要技术主题的发展脉络及其相互关系。[结果/结论]实证结果表明,将该方法应用于硬盘驱动器磁头领域,可以有效抽取其中主要技术主题的演化轨迹。
陈亮杨冠灿张静范云满
关键词:文本挖掘动态规划硬盘驱动器
面向医学数字资源长期保存的信息包封装模式研究
2021年
阐述3种典型的信息包封装模式基本原理并对3种模式进行对比分析。结合医学数字资源长期保存需求,提出面向语义化的医学数字资源封装模式,为长期保存仓储关联数据的形成、长期保存规划中的保存管理提供基础支撑。
范云满田丙磊杨晨柳王蕾姚宽达方安王茜
基于文献耦合的相似文献推荐算法实现被引量:2
2018年
在调研并总结相似文献推荐算法的基础上,提出一种基于文献耦合的相似文献推荐算法。分别采用离线式算法和在线式算法进行实现,从算法难度、复杂度、所需计算资源等方面进行对比分析,指出在线式算法更具有优势。
范云满方安陈凌云
基于LDA与新兴主题特征分析的新兴主题探测研究被引量:58
2014年
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
范云满马建霞
关键词:主题模型主题特征
基于主动学习的中文电子病历命名实体识别研究被引量:1
2020年
目的:开展基于主动学习的中文电子病历命名实体识别研究,旨在优化机器学习模型,并降低标注成本。方法:分析比较信息熵、语料长度以及随机查询3种不同算法,采用CCKS 2018 CNER评测语料,识别病历文本中的解剖部位、手术、药物、独立症状、症状描述5类实体。结果:在字数成本节约方面,基于熵的方法相比基于长度的方法节省了41%的字数;在语料成本节约方面,基于熵的算法相比随机抽样节省了46%的语料。结论:基于信息熵的主动学习方法通过选择待选标注集中最不确定的语料进行标注,可显著减少对标注语料的依赖,降低人工标注成本。
胡佳慧赵琬清方安范云满
关键词:命名实体识别信息熵
面向OAI-PMH协议的西太平洋地区医学索引数据服务设计与实践被引量:2
2019年
介绍西太平洋地区医学索引(WPRIM)系统在实现OAI-PMH协议,提供数据服务过程中面临且必须解决的3个问题,制定WPRIM元数据规范、WPIRM数据分组策略,以及基于网络带宽自适应的resumptionToken生成策略的基本方法,目前已在OAI-PMH官方网站上通过协议验证并实现数据服务注册。
范云满方安王蕾
关键词:西太平洋地区医学索引OAI-PMH协议元数据规范
医学大数据长期保存的技术策略分析
本文面对数据资源大数据的情形,提出了医学大数据面临的长期保存的问题。医学大数据的长期保存技术策略,本文将其分为现有的长期保存技术方法和医学数字资源的保存技术方法。现有的长期保存技术方法,着重通用性,面向一般的数字资源,包...
范云满
关键词:云服务
基于Hadoop/HBase的药物基因组数据云存储实践研究
本文首先分析了生物医学大数据的特点,从理论方面和数据查询对比试验两个方面,对比分析了以Oracle为代表的传统的关系数据库和以HBase为代表的NoSQL数据库在解决大数据问题各自采用的技术以及各自的优势与不足.接下来以...
范云满洪娜钱庆方安
文献传递
全球肿瘤疫苗临床转化现状分析被引量:2
2021年
目的了解全球肿瘤疫苗领域的临床转化现状。方法采集ClinicalTrials.gov中全球肿瘤疫苗相关临床试验数据,利用文献计量学方法,从数量与时间变化趋势、国家分布、申办者分布及构成、临床试验机构分布、研究类型与方法、临床试验分期和适应证等角度分析肿瘤疫苗临床试验注册现状。结果全球肿瘤疫苗相关临床试验共1772项,主要开展于美国(1102项),申办者以企业、高校及科研院所为主。其中,绝大多数为实验性研究(1740项),且大多处于临床试验Ⅰ期和Ⅱ期;临床试验最常见的适应证为黑色素瘤(448项)、淋巴瘤/白血病(347项)和乳腺癌/肿瘤(347项)。截至检索日期(2021年1月28日),按临床试验注册数量,中国尚处于第二梯队(102项)。结论全球肿瘤疫苗领域临床转化日趋活跃,但大多数疫苗离正式上市尚早。
卢岩范云满杨潇逸张婷欧阳昭连
关键词:肿瘤疫苗文献计量学
研究前沿探测方法概述被引量:11
2014年
在对研究前沿相关概念进行界定的基础上,从定性、定量等角度总结归纳了当前在探测研究前沿的方法,重点分析了基于引文的分析法和基于词汇的分析法,讨论了共词分析法的改进与完善。通过全面的归纳分析,总结比较了诸多方法的异同,提出对研究前沿探测方法的建议。
刘静马建霞范云满
关键词:词汇分析共词分析
共3页<123>
聚类工具0