郦芳
- 作品数:4 被引量:13H指数:2
- 供职机构:华东师范大学商学院信息学系更多>>
- 相关领域:文化科学医药卫生自动化与计算机技术更多>>
- 基于机器学习的生物多样性英文文档语义标注研究被引量:2
- 2011年
- 针对现有语义标注系统通用性差的问题,本研究设计了基于先导词算法的MARTT语义标注系统。MARTT利用有监督的机器学习方法从文本中提取领域规则,以适应不同的数据集。为了检验算法的效率,研究以中国植物志和北美植物志数据为样本,运用十折交叉论证方法与NB、SVM的标注性能进行了比较。结果表明,先导词算法在准确率、召回率及计算成本上均优于其它两种算法。而且,在两个不同的数据集上都获得了理想的结果,证实MARTT所具有的良好适应性。
- 崔红段宇锋郦芳
- 关键词:语义标注生物多样性
- 基于机器学习的生物多样性中文文档的信息抽取研究
- 信息抽取(Information Extraction)的核心在于识别和提取文档中用户感兴趣的数据,并以更为结构化、语义更为清晰的形式表示,为用户查询数据、应用程序利用数据提供便利。近年来国内外已有多位研究者面向各个领域...
- 郦芳
- 关键词:生物多样性信息抽取中文文档语义标注
- 国际视角下“中国AIDS问题”研究的文献计量分析被引量:3
- 2010年
- 目的从文献计量的角度反映近年来国际学术界对于"中国AIDS"问题的研究状况。方法选用WebofSci-ence引文数据为检索来源,通过以"China"及AIDS相关的名词构成的检索式搜集文献记录。利用SPSS、Metalab、Excel等软件从文献量、参与研究的国家机构、文献内容及合作有效性等4个方面进行统计分析。结果近10年来,有关我国AIDS的文献量呈逻辑曲线型增长,目前处于拐点位置,年文献增量接近峰值。从国家和机构的发文量来看,中、美两国都是主要研究力量。文献集中分布在医学、公共卫生及社会科学领域。核心作者的研究内容也十分集中,重点关注高危地区及高危人群,试图找到可行的干预模式,有效预防AIDS发展。合作有效性分析表明,存在国际合作关系的文献拥有较高的被引量且发表在影响因子较高的期刊上。结论中国AIDS问题已经引起了国内外研究者的广泛关注,相关文献在未来一段时间仍会保持高速增长。相关学者关注的领域存在许多共同点,研究热点较为鲜明。此外,国际合作与机构合作有利于增加文献的影响力。
- 郦芳高希瑞
- 关键词:获得性免疫缺陷综合征人类免疫缺陷病毒文献计量学
- 图书情报学学术团体现象实证研究被引量:8
- 2010年
- 通过1999~2008年10年间图书情报学领域刊载的所有论文,利用专门的可视化软件,研究了图书情报学论文合著关系网络。经研究发现了我国图书情报学现存的7个比较稳定和典型的学术团体,分析了各个学术团体的结构和组成成分,归纳了学术团体网络的类型,最后为更好地开展学术合作提出了一些建议。
- 刘璇郦芳
- 关键词:社会网络分析法可视化