国家自然科学基金(60875040)
- 作品数:3 被引量:58H指数:3
- 相关作者:王素格宋晓雷李德玉魏英杰吴苏红更多>>
- 相关机构:山西大学科学出版社山西职业技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向中文客户评论的产品属性抽取方法研究被引量:4
- 2012年
- 针对现有的中文客户评论产品属性识别方法存在的不足,通过采用词法分析、句法分析、同义词词林等多项技术和资源,挖掘真实语料中蕴藏的语言知识,提出了一种基于模板的产品属性识别方法。该方法对评论语料进行词法、句法分析和人工标注,从标注结果中综合分析和归纳评论句的全局语言规则,提取属性词和评价词之间的词性和依存关系序列,借助同义词词林构建产品属性模板,使用属性模板识别产品属性。对比实验结果表明了提出方法的有效性。
- 陈炯张虎曹付元张永奎
- 关键词:依存句法分析同义词词林
- 基于概率潜在语义分析的词汇情感倾向判别
- 本文利用概率潜在语义分析,给出了两种用于判别词汇的情感倾向的方法。一种是使用概率潜在语义分析获得每个目标词和基准词之间的相似度矩阵,再利用投票法决定每个目标词的情感倾向;二是利用概率潜在语义分析对目标词进行语义聚类和扩展...
- 宋晓雷王素格李红霞
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向
- 文献传递
- 基于依存关系的旅游景点评论的特征-观点对抽取
- 特征-观点对的抽取是观点挖掘中重要的研究课题之一,本文利用依存语法对句子的分析,研究了评论文本中特征-观点对的抽取。利用词对间的依存关系,构建了用于获取含情感倾向组块的规则以及候选评价对象的识别算法,在此基础上,设计了具...
- 吴苏红王素格
- 关键词:组块情感倾向
- 文献传递
- 面向特定领域产品评价对象自动识别研究
- 随着Internet技术的迅猛发展以及电子商务的不断普及,产品评价对象的识别已成为中文信息处理的一个研究热点。本文首先抽取候选评价对象。通过综合使用词形模板和词性模板以及在对候选评价对象评分之前进行预处理,提高了候选评价...
- 宋晓雷王素格李红霞
- 关键词:K均值聚类
- 文献传递
- 基于同义词的词汇情感倾向判别方法被引量:37
- 2009年
- 词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的词汇情感倾向判别方法,这种方法一定程度上避免了数据稀疏问题。实验结果表明,基于同义词的词汇情感倾向判别方法优于仅采用目标词与基准词的词汇情感倾向判别方法。
- 王素格李德玉魏英杰宋晓雷
- 关键词:计算机应用中文信息处理同义词
- 基于依存关系的旅游景点评论的特征-观点对抽取被引量:17
- 2012年
- 特征—观点对的抽取是观点挖掘中非常重要的研究课题之一。该文首先利用依存语法对句子进行了依存分析,在此基础上研究了旅游评论文本中特征-观点对的抽取。利用词对间的依存关系,构建了获取含有特征和观点词语的组块规则,并设计了候选特征的识别算法和特征—观点对的抽取算法。该文对山西旅游景点评论语料进行了实验,结果表明,特征—观点对的抽取整体的F1值达到了87.10%,验证了方法的有效性。
- 王素格吴苏红
- 关键词:组块
- 面向观点挖掘的汽车本体知识库的构建
- 建立了面向观点挖掘的汽车本体知识库,可为挖掘汽车整体信息和特性信息观点提供强大的数据资源。本文以汽车领域知识为背景,根据汽车知识的关系,构建了汽车本体知识库的概念关系。在此基础上,利用Web汽车评论真实语料库,自动获取了...
- 冯淑芳王素格
- 关键词:本体知识库
- 文献传递
- 一种混合语言信息的词语搭配倾向判别方法
- 具有较强褒贬倾向的二元词语搭配对于文本的情感分析具有重要的价值。本文提出了一种融合语言信息的二元词语搭配的情感倾向判别方法。该方法首先根据六种模式的词语搭配特点,确定出各模式的潜在语义模型,然后采用了概率潜在语义模型判别...
- 王素格杨安娜
- 关键词:词语搭配
- 文献传递