国家自然科学基金(61175068) 作品数:18 被引量:92 H指数:5 相关作者: 余正涛 郭剑毅 严馨 线岩团 石林宾 更多>> 相关机构: 昆明理工大学 中国石油天然气集团公司 红云红河烟草(集团)有限责任公司 更多>> 发文基金: 国家自然科学基金 云南省教育厅科学研究基金 教育部留学回国人员科研启动基金 更多>> 相关领域: 自动化与计算机技术 更多>>
Expert ranking method based on ListNet with multiple features 2014年 The quality of expert ranking directly affects the expert retrieval precision.According to the characteristics of the expert entity,an expert ranking model based on the list with multiple features was proposed.Firstly,multiple features was selected through the analysis of expert pages;secondly,in order to learn parameters through gradient descent and construct expert ranking model,all features were integrated into ListNet ranking model;finally,expert ranking contrast experiment will be performed using the trained model.The experimental results show that the proposed method has a good effect,and the value of NDCG@1 increased14.2%comparing with the pairwise method with expert ranking. 陈方琼 余正涛 毛存礼 吴则键 张优敏融合词频特性及邻接变化数的微博新词识别 被引量:10 2015年 大量的新词伴随着微博的快速发展而产生,这些新词具有传播速度快及与其他词组合方式灵活的特点,而且在进行分词处理时容易被切分为不同的字符串。提出了一种融合词频特性及邻接变化数的微博新词识别方法。该方法首先对大规模的微博语料进行分词,然后将在两停用词间的相邻字串两两组合,根据组合后的字串频率统计取得新词候选串,再通过组合成词规则进行筛选获得候选新词,最后通过词的邻接域变化特性去除垃圾串获得新词。利用该方法在COAE 2014评测任务上进行了新词的发现实验,准确率达到36.5%,取得了较好的成绩。 周超 严馨 余正涛 洪旭东 线岩团Expert Evidence Document Recognition Integrating Relationship of Expert Focus on the issue that the existing expert evidence document recognition method is not effective use of the r... Meng Wang Tao Shen Zhengtao Yu文献传递 融合语音情感词局部特征的语音情感识别方法 被引量:2 2017年 为有效利用语音情感词局部特征,提出了一种融合情感词局部特征与语音语句全局特征的语音情感识别方法。该方法依赖于语音情感词典的声学特征库,提取出语音语句中是否包含情感词及情感词密度等局部特征,并与全局声学特征进行融合,再通过机器学习算法建模和识别语音情感。对比实验结果表明,融合语音情感词局部特征与全局特征的语音情感识别方法能取得更好的效果,局部特征的引入能有效提高语音情感识别准确率。 宋明虎 余正涛 高盛祥 李铚 沈韬关键词:语音 情感识别 Research on Weakly-Supervised Entity Relation Extraction of Specific Domain Based on Entropy Minimization There are two major issues of automatic entity relation extraction: human intervention and difficulty in label... Jun Zhao Jianyi Guo Zhengtao Yu Peng Chen Cunli Mao文献传递 一种融合PageRank的协同过滤帖子推荐方法 被引量:1 2014年 针对贴吧用户面临严重的信息过载问题,提出一种基于用户信息的协同过滤帖子推荐方法.分析帖子推荐的属性特点后,首先利用一个融合了用户评论行为的PageRank算法去判断参与一个帖子讨论中各用户的重要性,主要考虑各用户之间的回复关系以及各用户之间回复的时间关系;然后把PageRank得分高的用户作为聚类中心进行k-means聚类;最后把帖子中聚类得到的用户与推荐系统使用者通过协同过滤算法计算相似度,并结合用户的PageRank得分,选择与用户相关度较高的帖子作为推荐结果.实验结果表明,该模型比现在使用的热门帖子推荐有着更好的表现. 曹阳 刘松 郭剑毅 余正涛 周枫 毛存礼关键词:PAGERANK 协同过滤 百度贴吧 基于主题信息的项目评审专家推荐方法 被引量:6 2014年 针对为项目自动推荐评审专家的任务特点,提出一种基于主题信息的专家推荐方法。在分析项目与专家描述文档的属性特点后,使用隐含狄利克雷分配模型获取文档内容的主题词,通过统计主题词词频的方法构建主题特征空间,并结合文档属性栏目的重要性因素,利用TF-IDF特征提取算法分别获得项目文档与专家文档的主题特征向量,采用改进的相似度算法计算项目与专家主题特征向量的相关度,并选择与项目相关度较高的专家作为推荐结果。实验结果表明,该方法的推荐效果优于使用TF-IDF+余弦相似度计算的推荐方法,准确率、召回率和综合评价指标F值平均提高了4.87%,5.04%和4.97%。 余峰 余正涛 杨剑锋 郭剑毅 严馨关键词:向量空间模型 相似度计算 基于LM算法的领域概念实体属性关系抽取 被引量:4 2014年 针对非结构化自由文本中关系模式比较复杂,关系抽取性能不高的问题,该文提出了利用BP神经网络的优化算法-LM算法,对非结构化自由文本信息中的领域概念实体属性关系进行抽取。首先对语料进行预处理,然后利用CRFs模型对领域概念的实例、属性和属性值进行实体识别,然后根据领域中各类关系的特点分别进行特征提取,构造BP神经网络模型,利用LM算法抽取相应关系。和适用于二分类问题的SVM相比,人工神经网络优化算法自主学习能力强,识别精度高,更适用于多分类的问题。通过几组实验表明,该方法在领域概念实体属性关系抽取方面取得了良好的效果,F值提高了12.8%。 刘丽佳 郭剑毅 周兰江 余正涛 邵发 张金鹏关键词:BP神经网络 LM算法 An Entity Answer Ranking Method Based on MLNs For the characteristics of factoid and list answers in domain Q&A system,we built a ranking model combined wit... Fangqiong Chen Zhengtao Yu Jianyi Guo Tao Shen Yantuan Xian文献传递 一种基于特征映射的中文专家消歧方法 被引量:1 2016年 针对中文专家页面特点,以及用于消歧的基准专家页面中信息涵盖不全的问题,该文提出一种基于特征映射的中文专家消歧方法。首先,采用条件随机场模型,从基准专家页面和待消歧页面中提取出所定义的12维人物属性特征,并利用最大熵分类模型,结合已有消歧结果训练出各属性特征的权重;然后,针对某个专家的基准页面,计算待消歧页面与该页面的相似度,根据设定的阈值判断该页面是否单独成类,若不是单独成类,则利用特征映射,扩充该页面的属性特征,结合模糊聚类方法,得到与该页面为一类的页面。在"自然语言处理"及"机器学习"领域进行中文专家消歧实验,结果表明提出的方法能有效对中文专家页面进行消歧。 潘霄 余正涛 郭剑毅 毛存礼 杨秀贞关键词:特征映射 模糊聚类