您的位置: 专家智库 > >

李欣

作品数:2 被引量:16H指数:2
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:山西省科技攻关计划项目山西省回国留学人员科研经费资助项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇情感分类
  • 1篇维度
  • 1篇文本
  • 1篇集成分类器
  • 1篇过抽样
  • 1篇分类器

机构

  • 2篇山西大学

作者

  • 2篇王素格
  • 2篇李德玉
  • 2篇李欣
  • 1篇赵传君

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程与...

年份

  • 2篇2015
2 条 记 录,以下是 1-2
排序方式:
面向文本情感聚类的维度判别方法被引量:4
2015年
在文本情感分析时,使用有监督的机器学习方法的不足是需要大量的带标签的文本数据,而无监督的文本聚类方法可以克服这一问题。对于文本情感聚类,在节省数据资源的同时,也存在聚类结果的不确定性问题。给出了情感维度的形式化描述,并将观点词识别技术应用于情感维度的判别中。在此基础上,利用获得的情感维度,对评论文本进行情感聚类,有效地解决情感聚类结果的不确定性问题。在4个领域的英文产品评论数据上进行实验,结果表明该方法在自动识别情感聚类维度中是有效的,并得到了满意的情感聚类结果。
李欣王素格李德玉
基于分组提升集成的跨领域文本情感分类被引量:12
2015年
针对目标领域带标签数据偏少的问题,综合运用半监督学习、BootStrapping、数据分组、AdaBoost、集成学习等策略与技术,提出了一种基于分组提升集成的跨领域文本情感分类方法.该方法首先利用少量人工标注的目标领域数据,基于合成过抽样技术产生一定数量的虚拟数据.在此基础上,采用BootStrapping方法获得更多目标领域高可信度的带标签数据.在分类器的构建方面,首先将源领域的带标签数据等量分割,并分别与目标领域带标签数据组合,在每个组合数据块上运用AdaBoost方法提升地训练多个分类器,并将这些分类器线性地集成为一个分类器.在亚马逊购物网站4个领域的情感数据集上的实验表明,基于分组提升集成的跨领域文本情感分类方法一定程度上提高了跨领域文本情感分类的精度.
赵传君王素格李德玉李欣
关键词:情感分类集成分类器
共1页<1>
聚类工具0