您的位置: 专家智库 > >

国家自然科学基金(61363039)

作品数:2 被引量:32H指数:2
相关作者:万常选江腾蛟刘德喜刘喜平刘玉更多>>
相关机构:江西财经大学更多>>
发文基金:江西省自然科学基金国家自然科学基金江西省高校人文社会科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇动词
  • 1篇动词特征
  • 1篇多特征融合
  • 1篇心理健康
  • 1篇隐式
  • 1篇语言
  • 1篇语言特征
  • 1篇实体关系抽取
  • 1篇陪义
  • 1篇关系抽取
  • 1篇抽取

机构

  • 2篇江西财经大学

作者

  • 2篇刘喜平
  • 2篇刘德喜
  • 2篇江腾蛟
  • 2篇万常选
  • 1篇甘丽新
  • 1篇刘玉

传媒

  • 2篇计算机学报

年份

  • 2篇2019
2 条 记 录,以下是 1-2
排序方式:
基于协陪义动词的中文隐式实体关系抽取被引量:4
2019年
实体关系抽取的目标在于探测实体之间的显式关系和隐式关系.现有研究大多集中在显式实体关系抽取,而忽略了隐式实体关系抽取.针对旅游和新闻领域文本经常包含许多由协陪义动词引发的隐式实体关系,本文研究了基于协陪义动词的中文隐式实体关系抽取问题.将机器学习方法与规则相结合,借助于显式实体关系对隐式实体关系进行推理.首先,利用依存句法分析,设计了协陪义候选句型分类算法以及相应的协陪义成分识别算法;其次,根据协陪义成分和协陪义动词作用范围的特点,设计了三种句内基于协陪义动词的隐式实体关系推理规则;最后,利用协陪义句中零形回指的先行词,建立不同句子中协陪义动词的主体成分与客体成分之间的联系,实现句间基于协陪义动词的隐式实体关系抽取.另外,本文还提出了趋向核心动词特征提取算法,进一步提高了动词特征对显式实体关系抽取的效果.基于真实的旅游领域和新闻领域文本数据集进行了详细的实验测试,实验结果表明了方法的有效性.
万常选甘丽新江腾蛟江腾蛟刘德喜刘喜平
关键词:关系抽取动词特征
基于多特征融合的在线论坛用户心理健康自动评估被引量:28
2019年
心理健康问题会对社会和谐和家庭幸福造成严重破坏,提前发现有心理健康问题的潜在患者,有利于对其进行及时辅导和治疗.人们利用互联网或社交网络交流沟通、表达情感和观点,这为心理健康的观察提供了新的窗口.本文提出基于多特征融合的在线论坛用户心理健康自动评估框架F 3 TMH,该框架采用贪婪法F 3 TMH_G、投票法 F 3 TMH_V、后期融合法F 3 TMH_L和降噪自编码器法F 3 TMH_DA四种特征融合策略,融合帖子(或其作者)的行为与属性特征、语言或用词风格特征、内容特征(N-Grams特征、主题特征、词向量特征)、上下文特征,对论坛中帖子所反映的用户(心理康健状况)需要干预的紧急程度( crisis :非常紧急, red :紧急, amber :不紧急, green :不需要任何干预)进行自动评估.在CLPsych2017 shared task评测任务所提供的数据集上,考察了各类特征、不同的特征融合策略对心理健康自动评估性能的影响.实验发现,相对于行为与属性特征和语言特征,内容特征表现更好,其中基于Word2Vec的词向量特征表现最佳,其 Non -green ( crisis 、 red、amber 三类)的 F1 均值达到0.429.尽管单独使用行为与属性特征表现不佳,但该特征对 crisis 类帖子的识别影响很大,在融合所有特征的基础上去掉该特征后会导致 crisis 类帖子的 F1 值下降19.7%.实验还显示,多种类型特征的融合较单一类型的特征表现更优,特征融合后 Non -green 的 F1 值(0.479)较单一最优特征(0.429)提高11.6%.各种特征融合策略各有优势,例如,后期融合策略F 3 TMH_L2更有利于识别心理健康危机程度较高的用户( crisis 和 red 类帖子), Urgent 的 F1 值达到0.608,而F 3 TMH_L则更有利于识别 crisis 类的帖子,自编码融合策略F 3 TMH_DA对于识别数据量相对较多的 Flagged 类(所有非 green 类的并集)帖子更有优势,其 F1 值达到0.872.最后还探讨了上下文信息对用户心理危机程�
刘德喜夏先益万常选刘喜平江腾蛟付淇
关键词:语言特征多特征融合
共1页<1>
聚类工具0