余传明 作品数:83 被引量:748 H指数:16 供职机构: 中南财经政法大学信息与安全工程学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 教育部人文社会科学研究重大课题攻关项目 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 政治法律 更多>>
基于深度强化学习的查询扩展模型研究 被引量:5 2019年 文章在传统的伪相关反馈基础上引入深度强化学习的查询扩展方法来改善信息检索中由词不匹配造成的检索效果不佳问题。选择eBay于2017年发布的用户查询与商品名称作为实验数据,利用深度学习框架抽取词的抽象特征,并把召回率作为奖励,使用强化学习方法对扩展词进行选择。当使用召回率、精度和平均精度均值三个指标对模型进行评价时,文章提出的基于深度强化学习的查询扩展方法明显优于基线方法(原始查询、基于TF-IDF的查询扩展、基于余弦相似度的查询扩展和基于深度学习的查询扩展),扩展后的查询检索效果在召回率上比原始查询高1.32%。实验结果表明基于深度强化学习的查询扩展模型能够改善词不匹配带来的问题,提高系统检索效果。 余传明 胡莎莎 叶鹏昊 安璐关键词:查询扩展 信息检索 以CMM为导向的软件过程改进探讨 该文以软件企业的过程改进为研究对象,提出了以CMM为参照,通过PSP改进软件研发人员个人软件过程,通过TSP改进小组软件过程,从而不断提高企业软件过程能力的思路.全文共分6个部分:第一部分:分析了软件产品、软件产业的特点... 余传明关键词:能力成熟度模型 软件过程改进 个人软件过程 小组软件过程 文献传递 基于深度循环神经网络的跨领域文本情感分析 被引量:22 2018年 [目的/意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法/过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型。实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81.70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory, Stacked-LSTM)模型(79.90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory, Bi-LSTM)模型(80.50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory, CNN-LSTM)(74.70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory, Merged-CNN-LSTM)模型(80.90%)。[结果/结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。 余传明关键词:情感分析 基于生成对抗网络的跨语言文本情感分析 被引量:5 2019年 [目的/意义]将跨语言文本情感分析分为跨语言向量对齐、文档向量生成和分类器迁移三个模块,探究不同模块对跨语言文本情感分析效果的影响。[方法/过程]选择亚马逊在书籍、音乐和DVD类目下的商品评论作为实验数据,首先采用生成对抗网络对源语言和目标语言进行语义映射,然后使用平均法获取文档向量,最后通过支持向量机进行情感分类。[结果/结论]当使用F1值作为评价指标时,与基线方法相比,本文所提出的跨语言情感分析方法受领域和语言变化的影响较小,具有较强的鲁棒性,在整体上取得了较高的准确率。实验结果表明跨语言情感分析方法能够有效应对目标语言标注语料资源匮乏问题,从而改善情感分类准确率。[局限]只在三种语言上进行了跨语言情感分析实验,后续将在更多的语言情境下探究本文方法的效果。 余传明 王峰 胡莎莎 安璐关键词:神经网络模型 支持向量机 基于深度学习的词汇表示模型对比研究 被引量:7 2020年 【目的】系统揭示传统深度表示模型与最新预训练模型的原理,探究其在文本挖掘任务中的效果差异。【方法】采用对比研究法,从模型侧和实验侧分别比较传统模型与最新模型在CR、MR、MPQA、Subj、SST-2和TREC六个数据集上的效果差异。【结果】在六个任务中,XLNet模型取得了最高的平均F1值(0.9186),优于ELMo(0.8090)、BERT(0.8983)、Word2Vec(0.7692)、GloVe(0.7576)和FastText(0.7506)。【局限】由于篇幅限制,实证研究以文本挖掘中的分类任务为主,尚未比较词汇表示学习方法在机器翻译、问答等其他任务中的效果。【结论】传统深度表示学习模型与最新预训练模型在文本挖掘任务中的表现存在较大差异。 余传明 王曼怡 林虹君 朱星宇 黄婷婷 安璐关键词:知识表示 文本挖掘 一种新的信息系统——语义信息系统 被引量:2 2006年 本文提出了一种新的信息系统——语义信息系统,分析它的产生背景、定义、结构和特点,并论述了它与传统的管理信息系统、决策支持系统、竞争情报系统、专家系统的区别。 余传明关键词:信息系统 信息检索 基于深度表示学习的跨领域情感分析 目的:通过在标注资源丰富的源领域中学习,并将目标领域的文档投影到与源领域相同的特征空间中去,从而解决目标领域因数据量较小难以获得好的分类模型的问题.
方法:选择亚马逊在线购物网站在书籍、DVD和音乐类目下的中文... 余传明 冯博琳 安璐关键词:文本信息 情感分析 知识迁移 突发公共卫生事件微博影响力的预测研究 被引量:14 2017年 [目的/意义]突发公共卫生事件的迅速蔓延性与高度危害性使得相关管理部门不得不在短时间内做出有效的应对措施。对突发公共卫生事件的微博影响力进行预测有助于及时发现即将出现的问题,提高决策的预见性。[方法/过程]从微博条目的转发、评论和收藏次数来衡量其影响力,利用基于BM25的潜在狄利克雷分配模型和随机森林方法,选取埃博拉爆发相关微博的发布者、时间和内容特征,构建了突发公共卫生事件的微博影响力模型。[结果/结论]该模型能较好地预测微博的影响力,准确率达到88.8%。微博条目的发布者类型、主题等特征对微博条目的影响力产生主要作用,各项特征具有不同的影响力倾向。 安璐 易兴悦 余传明 李纲关键词:突发性公共危机 基于本体的语义信息系统研究 语义信息系统是情报学研究的一个全新的领域,对这个新兴的领域进行探索具有非常重要的意义。首先,能够从一定程度上满足人们知识需求的需要,知识经济的发展使得人们对于信息的需求也发生了根本的变化,人们对于信息的需求转化为知识需求... 余传明关键词:信息抽取 语义检索 信息可视化 文献传递 基于Internet的信息组织研究 被引量:43 2001年 “文献爆炸”导致了文献的极度分散与用户的信息需求相对集中的尖锐矛盾 ,基于对一次文献进行综合、简化、浓缩和索引的传统文献信息组织模式应运而生———传统的情报学也正是在这样的背景下得到了迅速的发展。网络的发展使得我们面临新的挑战 ,如何解决巨大网络信息量与特定的用户需求的特定矛盾 ,成为当务之急。本文正是基于这一现实 ,分析了网络信息收集与网络信息组织的基本方法 ,并以“图书馆学情报学虚拟图书馆”为例 。 董慧 余传明关键词:INTERNET 信息组织 信息资源管理 检索查询