国家自然科学基金(61170180)
- 作品数:3 被引量:29H指数:3
- 相关作者:商琳郭敏贾修一周哲张莉更多>>
- 相关机构:南京大学南京理工大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于动态词典和三支决策的情感分析方法被引量:12
- 2015年
- 提出了一种新的特征提取方式,与三支决策思想相结合,运用在文本情感分析中,以提高分类器的效率。根据训练集合创建动态情感词典,然后根据情感词典提取文本的抽象特征,形成特征矩阵。在分类过程中,如果分类器对于目标文本的所属分类确信程度不够高,那么分类器会利用三支决策的思想,将文本置于边界域中,等待别的处理方法。实验结果表明,在英文影评数据集上,基于动态词典的特征提取方法可以取得更好的分类准确率,而且三支决策规则可将一些样例放入边界域,提高了分类准确率。
- 周哲商琳
- 关键词:情感分析文本数据挖掘特征抽取
- 跨领域中文评论的情感分类研究被引量:4
- 2013年
- 主要对跨领域中文评论句中的各个评价对象所对应的观点表达的情感倾向进行研究。在结合单一领域特别是产品领域中情感分类的常用算法以及结合跨领域评论观点表达的特殊性的基础上,提出了基于词典资源和有监督机器学习这两种方法来对跨领域中文评论句进行情感分类,探讨了跨领域中文评论在算法上与单一领域的异同,同时对两种方法进行了比较。实验结果表明,提出的方法具有较大的实用价值。
- 张莉
- 关键词:情感分类知网支持向量机
- 基于模糊化的决策粗糙集属性约简和分类被引量:13
- 2014年
- 决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模糊隶属度函数代替传统的后验概率求解方法,这样可推导出新的决策规则,进而可高效处理那些包含连续型属性的信息系统.实验表明该方法是可行的,并且可通过调整隶属度函数,达到更佳分类效果.
- 郭敏贾修一商琳
- 关键词:模糊集隶属度函数