国家自然科学基金(60803085)
- 作品数:3 被引量:54H指数:3
- 相关作者:程学旗谭松波林政云晓春杜伟夫更多>>
- 相关机构:中国科学院中国科学院大学哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Kad网络节点共享资源探测分析
- Kad网络中存在数百万的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关统计分析。我们发现:1)只有3.09%的节...
- 刘祥涛龚才春曾依灵白硕鲍旭华
- 关键词:对等网络KAD网络
- 文献传递
- 基于情感关键句抽取的情感分类研究被引量:27
- 2012年
- 情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
- 林政谭松波程学旗
- 关键词:情感分类关键句分类器融合有监督学习半监督学习
- 基于随机游走模型的跨领域倾向性分析研究被引量:11
- 2010年
- 近年来,研究者们已经在跨领域倾向性分析方面取得了一些进展.然而,现有的方法和系统往往只根据已标注文本或者已标注情感词对目标领域文本进行倾向性分析,却缺乏一个统一的模型框架将文本与情感词之间全部知识进行有机的融合.提出了一种基于随机游走模型的跨领域倾向性分析方法,该模型能够同时利用源领域和目标领域文本与词之间的所有关系来对文本与词进行互相增强,旨在将文本之间的关系、词之间的关系、文本与词之间的相互关系集成到一个完整的理论框架中.实验结果表明,提出的算法能大幅度提高跨领域倾向性分析的精度.
- 吴琼谭松波许洪波段洣毅程学旗
- 关键词:中文信息处理随机游走图模型
- 基于图排序模型的跨领域倾向性分析算法
- 倾向性分析因其重要性而受到广泛关注。通常,监督分类方法对倾向性分析很有效。但是,当训练域与测试域不在同一个领域时,这些算法的性能明显下降。本文提出一个算法,将文本的情感倾向性与图排序算法结合起来进行跨领域倾向性分析。本算...
- 吴琼谭松波张刚段洣毅程学旗
- 文献传递
- 一种新的情感词汇语义倾向计算方法被引量:21
- 2009年
- 当前,人们越来越倾向于通过互联网(论坛、讨论组、博客)表达自己对事物的观点、意见.如何利用计算机自动、有效地挖掘这些信息是一个具有挑战性的问题,并且在企业智能分析、政府舆情分析等领域具有广阔的应用空间和发展前景.文本倾向分析就是以挖掘、分析文本中所包含的情感信息为目的的一种技术,它是传统的话题发现与跟踪研究的拓展和深化,并为其提供了新的思路和方法.文本倾向分析的基础是词语语义倾向计算.提出一个可扩展的词汇语义倾向计算框架,将词语语义倾向计算问题归结为优化问题.在算法实现上,首先利用多种词语相似度计算方法构建词语无向图;然后利用以"最小切分"为目标的目标函数对该图进行划分,并利用模拟退火算法进行求解.实验证明了该框架的合理性以及求解方法的有效性.
- 杜伟夫谭松波云晓春程学旗
- 关键词:计算机应用中文信息处理语义倾向模拟退火算法