沈一
- 作品数:3 被引量:24H指数:2
- 供职机构:中国科学院计算机网络信息中心更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于科研在线文档库平台的标签推荐系统被引量:1
- 2014年
- 科研在线文档库是一个面向团队的文档协同与管理工具,为虚拟团队提供合作平台。它采用标签系统的方式组织其中的所有文档。在文档库的使用过程中,出现了无标签文档数量的累积以及用户为文档添加的标签质量偏低问题,影响文档的分类和共享。针对该问题,采用适用于科研在线文档库平台的标签推荐方法,包括协同过滤以及关键词抽取2个部分,促使用户为文档添加合格的标签,提高文档系统的使用效率。协同过滤推荐部分的实验采用准确率和召回率衡量标准,关键词抽取部分采用用户调查的实验方式,实验证明为每个文档提供3个候选标签能够得到理想效果。在实际使用环境中,该系统具有较高的精确度和可靠性,简单易于实现。
- 蔡芳沈一南凯
- 关键词:标签推荐标签系统协同过滤抽取冷启动
- 一种解决“中心主题湮没问题”的基于图模型的Labeled-LDA文本分类算法被引量:4
- 2014年
- 隐含狄利克雷分配(LDA,Latent Dirichlet Allocation)是一种用于挖掘文档集中潜在主题信息的无监督主题模型。而LDA模型的变形Labeled-LDA则可以作为有监督的多标签分类器,它建立了主题与标签的一一映射,从而学习出词与标签之间的关系。近年来,图模型在文本挖掘方面的应用取得了良好的效果,通过对文档建立图模型,为进一步分析文档的语义提供了新的途径。提出了一种利用Labeled-LDA和文档图模型进行文本分类的新算法,与传统的LDA模型方法相比,该方法的性能有较大的提高。
- 李伟马永征沈一
- 关键词:文本分类图模型
- 基于图计算的论文审稿自动推荐系统被引量:19
- 2016年
- 针对传统审稿方式所存在的问题,设计了基于TextRank图算法思想的论文推荐系统,以实现论文审稿分配过程的自动化。系统通过加入词与词之间的影响力计算以及多文档集中逆文档频率IDF,实现关键词抽取部分,并使用基于余弦向量值的计算对抽取出的关键词向量进行相似度匹配,最后计算审稿人在各研究领域的影响力,实现论文的推荐。采用了综合考察准确率、召回率的F值作为评测指标,验证了该方法的有效性。在实际使用环境中,该系统具有较高的准确性与可靠性。
- 谢玮沈一马永征
- 关键词:论文推荐推荐系统关键词抽取相似度计算