郑丽娟
- 作品数:20 被引量:188H指数:8
- 供职机构:聊城大学商学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
- 相关领域:经济管理自动化与计算机技术语言文字社会学更多>>
- 基于句子级情感的中文网络评论的情感极性分类被引量:26
- 2013年
- 为提高网络评论段落的情感极性分类准确率,在考虑人们表达习惯和语料粒度的基础上,提出一种基于句子情感的段落情感极性分类方法.该方法通过句子的情感极性和句子的情感极性贡献度来对段落进行情感分类,采用传统分类方法预测句子的情感极性,提出等权重、相关度、情感条件假设3种方法,能够根据训练语料的统计数据动态地确定段落中不同位置句子的情感极性贡献度.最后,以超过2个句子的手机和酒店网络评论为对象进行实验分析,实验结果显示,与传统方法相比,考虑了人们表达习惯的相关度和情感条件假设方法显著提高了段落分类的准确率,且具有一定的自适应性.
- 王洪伟郑丽娟尹裴何绍义
- 我国农村社会保障支出效率地区差异测度
- 2019年
- 利用2009-2014年的面板数据,运用DEA方法,对中国30个省份的农村社会保障支出效率地区差异进行了实证分析。研究表明,2009-2014年,我国农村社会保障支出技术效率在整体上呈现出下降趋势,并存在明显的地区差异,即西部地区>东部地区>中部地区;上海、山东、贵州三省市属于DEA有效,其投入产出比达到最佳状态。
- 倪永良唐娟莉郑丽娟张云燕
- 关键词:农村社会保障技术效率
- 中文比较关系的识别:基于注意力机制的深度学习模型被引量:8
- 2019年
- 商品在线评论中存在着大量的比较语句,其中蕴涵着用户对不同商品或服务的体验及评价。通过挖掘评论文本中的比较信息,能够帮助企业洞察产品的市场竞争力。本文关注中文评论中的比较句识别任务,摒弃了先前研究中经常采用的模式识别方法,提出基于深度学习方法的层次多注意力网络模型。该模型获得了较好的识别精度,优于传统的分类模型和常见的深度学习文本分类模型,F1分数达到81%。本文提出的层次多注意力网络模型是端到端的,缩减了大量人工干预,有效简化了比较评论识别的工作量。
- 朱茂然王奕磊高松王洪伟郑丽娟
- 关键词:文本分类
- 基于情感词模糊统计的网络评论情感强度的研究被引量:16
- 2014年
- 根据已有在线声誉系统特点,将用户的情感强度划分若干级别。考虑到情感强度的模糊性,为每个情感强度设置隶属度函数。在此基础上,提出一种基于情感词模糊统计的网络评论情感强度计算方法,并选取手机评论进行实验分析。实验结果显示:情感词的隶属度具有集中性和稳定性;否定词不但改变情感词的极性,还弱化情感词的情感强度;程度副词强化情感词的情感强度,但被修饰情感词的情感强度越大,程度副词对该词的强化程度越小。
- 郑丽娟王洪伟郭恺强
- 关键词:模糊统计
- 基于创新驱动视角的中国省际技术创新效率测度及影响因素分析被引量:6
- 2019年
- 基于创新驱动视角,以中国2000—2015年30个省份的面板数据为样本,采用DEA-Tobit两阶段模型,测度了中国省际技术创新效率,并对其影响因素进行了实证研究。研究表明,2000—2015年,中国技术创新效率均值为0.771,尚有较大的提升空间;各地区技术创新效率呈现出梯度变化特征;北京、上海、浙江、海南、内蒙古、重庆、贵州、云南、甘肃、新疆等10个省份处于效率前沿面上,其余省份均处于技术无效状态;中国省际技术创新效率地区差异显著,发展不均衡,全国技术创新效率变异系数为0.0646;技术创新效率呈较明显的空间集聚状态;经济发展水平、基础设施、信息化水平是影响中国省际技术创新效率的重要因素。
- 唐娟莉倪永良郑丽娟
- 关键词:技术创新影响因素
- 区域技术创新动态能力培育的影响因素——基于省级面板数据的实证分析被引量:3
- 2019年
- 利用2011—2015年全国31个省份的面板数据,采用因子分析法和面板数据模型,实证研究了区域技术创新动态能力培育的影响因素。结果表明:区域技术创新动态能力培育有赖于提高R&D经费投入、对外开放水平和城市化水平,其中城市化水平的作用最为突出;经济发展水平对区域技术创新动态能力培育的作用不显著;科教事业政策抑制了区域技术创新动态能力的培育,即政府的“政策红利效应”并不显著。
- 唐娟莉倪永良郑丽娟张云燕
- 关键词:影响因素
- 农民收入倍增能力测算及其影响因素分析被引量:1
- 2018年
- 研究利用2013~2015年统计数据,运用因子分析法和随机效应面板模型,测算全国30省市区农民收入倍增能力,并实证研究影响因素。研究表明,2013~2015年我国农民收入倍增能力呈东高西低趋势,即东部地区最高,中部地区次之,西部地区最低。具体而言,3年间我国30省市区农民收入倍增能力呈不同变化趋势,即收入倍增能力区域差异显著,且呈非平衡化发展趋势;北京、天津、辽宁等省市区农民收入倍增能力较强,湖南、宁夏、陕西等省市区处于中游水平,青海、甘肃、贵州等省市区较弱;教育水平、财政支持度、城镇化水平和地理区位等对东中西部地区农民收入倍增能力差异影响显著,制度保障具有正向影响,价格水平产生负向影响,产业结构无显著影响。
- 唐娟莉倪永良郑丽娟
- 关键词:农民收入影响因素
- 供应链环境下本体驱动的信息共享模型被引量:4
- 2012年
- 采用本体建模方法,对供应链环境下,信息共享的语义异构问题进行研究。构建了供应链环境下的客户本体,在此基础上,提出了一个本体驱动的信息共享模型,给出该模型的基本框架,描述了供应链环境下本体驱动的信息共享的流程,并阐述信息共享请求方及应答方的行为。该模型利用本体论的思想,实现了供应链环境下语义层面上的信息共享,可在较少人工参与的情况下,获得理想的信息共享效果。
- 王洪伟郑丽娟韩子文
- 关键词:本体供应链信息共享
- 中文网络评论的情感分类:句子与段落的比较研究被引量:5
- 2013年
- 针对句子和段落两种粒度的语料,采用机器统计学习方法,对可能影响中文网络评论情感分类效果的因素进行实验研究。选取N-gram作为情感文本的潜在特征项,利用文档频率、X2统计量以及期望交叉熵对特征项实施降维处理,采用布尔权重法构建特征向量,并采用SVM分类器进行网络评论的情感分类。研究发现,语料的粒度对分类准确率的影响较大,句子粒度和段落粒度的分类准确率约相差10%;特征降维方法对句子和段落的分类准确率都有一定影响,且分类效果各有优劣,因此应根据不同需要进行选择;Unigram、Bigram分类效果的优劣受到语料粒度和特征降维方法的影响,因此并非一成不变。
- 郑丽娟王洪伟郭恺强
- 关键词:网络评论情感分类句子段落
- 基于情感本体的在线评论情感极性及强度分析:以手机为例被引量:24
- 2017年
- 对在线评论进行情感分析,有利于消费者制定购买决策,也有利于商家确定营销策略。已有对在线评论的研究,多单独采用语义方法或统计方法进行单粒度的情感分类。语义方法借助已有情感词典,忽略了上下文语境,影响分类准确率;统计方法需要对大量语料进行人工标注,影响分类效率;只针对单粒度语料分类,不能同时获得用户对产品整体和细节特征的观点,影响分类结果的应用性。针对以上问题,本文提出一种基于情感本体的在线评论情感极性及强度分析方法。首先,根据已有在线声誉系统和中文网络词汇特点,结合语义方法和统计方法,通过特征观点对的抽取和观点词情感的判断,构建情感本体。情感本体的构建既考虑了上下文语境,又不需要预先的语料标注;其次,通过情感本体的应用,实现了在线评论的评论整体和具体特征的情感极性及强度分析。通过对手机评论的实验,结果显示,通过应用该情感本体,可以有效地给出用户对产品整体和属性细节的满意或不满意的态度。
- 郑丽娟王洪伟
- 关键词:情感分类情感本体手机