郭红梅
- 作品数:34 被引量:200H指数:8
- 供职机构:中国科学院文献情报中心更多>>
- 发文基金:国家自然科学基金国家社会科学基金辽宁省教育厅高等学校科学研究项目更多>>
- 相关领域:文化科学自动化与计算机技术医药卫生自然科学总论更多>>
- 基于概念向量的文本语义相似度方法探索
- 2017年
- 在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。
- 郭红梅袁国华胡正银
- 关键词:语义相似度文本相似度
- 文献半衰期研究现状被引量:29
- 2011年
- 介绍半衰期的定义,阐明期刊引用半衰期、期刊被引用半衰期以及论文半衰期的概念及研究状况,论述期刊半衰期与其它指标的关系、半衰期计算方法及文献老化模型,以期较为全面地反映文献半衰期的研究现状。
- 郭红梅邵艳娥何钦成
- 关键词:科学计量学指标
- 不同自然科学门类间论文学术影响力多指标综合评价的合理性研究被引量:8
- 2012年
- 以2006-2010年物理学、化学、医学或生物学三个学科门类诺贝尔奖获者得突出贡献文献(参比论文)和与其研究领域密切相关的论文(非参比论文)为研究对象,在原有研究基础上结合统计学分析结果,从12个与论文学术影响力密切相关或一般相关的计量指标中最终筛选出7项组成综合评价体系,利用主成分分析法计算每篇论文的综合评价值(以下简称"F值")。结果表明,综合评价指标体系及其所获F值在总体上相对他引量可以更好地表征高学术影响力论文的品质,并且在一定程度上"纠正"仅以他引量对不同科学门类论文评价时出现的系统偏倚,具有在跨科学门类论文评价、比较上的可应用性。
- 郭红梅何苗邢星金晶何钦成
- 关键词:跨学科论文评价
- 基于分布式大数据技术的科学计量模块化分析平台构建研究被引量:3
- 2020年
- 【目的】设计开发模块化计量指标分析平台,满足计量分析人员多维条件定制、实时高效计算的计量分析需求。【应用背景】面对海量科学文献数据,传统关系数据库进行大数据量计量计算时效率较低,计算时间长,分布式大数据技术为实时性科学计量分析平台提供了技术基础。【方法】设计计量指标管理模型及基于工作流的指标构建流程,将分析任务分解为多个可独立计算单元;基于分布式大数据ES索引、Redis集合计算、预计算指标等技术,将计算统计任务转化为倒排索引查询及集合运算等操作。【结果】为用户提供标准化的指标选择构建流程、可动态扩展的弹性任务配置及准实时的指标计算支持。【结论】以分布式大数据技术为基础,对计算任务抽象分装,实现了高效、通用的模块化分析平台,同时本研究也可为相关分析决策系统提供参考。
- 师洪波郭红梅郭红梅岳婷黄定余钱力
- 关键词:分布式技术
- 不同地区高校“图书馆、情报与文献学”国家社科基金立项研究被引量:2
- 2017年
- 文章从地区分布角度对国家社科基金数据库1991—2015年"图书馆、情报与文献学"领域高校的立项项目数据进行计量分析,从立项时间分布、类别统计、单位分布、负责人情况、结项情况等方面,揭示不同地区高校图情档立项现状、发展趋势及存在问题,以期为不同地区高校申报者结合本地区优势合理申报国家社科基金提供参考。
- 刘娟邹义民郭红梅
- 关键词:高校国家社科基金
- 对2005—2009年JCR(自然科学版)计量指标的分析研究
- 2011年
- 从学科分布角度对2005-2009年JCR(自然科学版)的主要计量指标载文量、被引频次、影响因子等进行统计分析,探讨各指标在5年间的变化情况。
- 郭红梅金晶何钦成
- 关键词:JCR
- Digital Curation和Digital Preservation之概念辨析被引量:20
- 2014年
- 【目的】对Digital Curation和Digital Preservation这两个相关概念进行辨析。【文献范围】以历史上与Digital Curation和Digital Preservation相关的重要文献和重要报告为基础,并调研分析DCC、JISC、ARL等主要机构对两个概念的各种定义。【方法】基于两个概念形成的历史,分析两个概念产生和发展的深层原因;基于当前主要研究团体和个人对两个概念的多个定义,分析两个概念的不同;进一步从8个方面入手,多角度对这两个概念的不同点进行对比分析。【结果】Digital Curation和Digital Preservation虽然都可用于数字保存和管理,但它们的确是两个不同的概念,在很多方面有较大的差别。【局限】尚需对Digital Curation和Digital Preservation所包括的具体工作内容进行较为细致的对比分析。【结论】Digital Curation和Digital Preservation是两个不同的概念,但二者互补,图书馆应当采用一种更为积极主动的方式来推进数字保存和管理。
- 张智雄吴振新刘建华郭红梅
- 关键词:DIGITALCURATIONDIGITAL
- 表征论文声望的指标:引文加权值被引量:2
- 2011年
- 本文利用2000-2008年scientometrics期刊上所刊载的论文在2000-2008年的引文数据为研究对象,在被引次数的基础上同时加入施引期刊的学术质量指标和引证时差权重,计算每篇论文的引文加权值,通过被引次数和引文加权值的比较得出引文加权对论文的评价更为合理,同时以2000-2008年在scientometrics发文量最多的10名作者为研究对象,探讨引文加权用于作者评价的可行性。
- 郭红梅金晶何钦成
- 关键词:论文评价
- 基于“主语-谓语-宾语”三元组的知识发现研究——以诱导多能干细胞领域为例被引量:6
- 2017年
- 本文提出基于"主语-谓语-宾语(Subject-Predication-Object,SPO)"三元组的生物医学领域知识发现框架,对该框架的关键技术和实施流程进行研究。首先,基于UMLS语料库,利用Sem Rep工具从生物医药文献中抽取SPO三元组;其次,基于领域知识组织体系,结合自定义词表和清洗规则对SPO进行清洗和筛选;再次,利用Net Miner分别绘制以Subject和Object为中心节点,Predication为边的语义网络图;最后,结合专家解读,实现领域知识发现。本文以诱导多能干细胞领域为例进行实证研究。结果显示,SPO三元组可细粒度地揭示科技文献的知识内容,基于SPO的语义网络能直观地支持领域知识发现,该框架具有兼容、高效、易实施等优点。
- 隗玲胡正银庞弘燊覃筱楚郭红梅方曙
- 关键词:知识发现知识组织语义网络
- 基于有向加权网络结点重要性测度方法研究
- 2014年
- 论述有向加权图中结点重要性测度方法研究的国内外现状,总结数种常用的有向图中心度测度方法及其在重要性排序等方面的应用,介绍最新两个图挖掘系统以及对中心度研究的思考。
- 郭红梅张智雄刘振