国家社会科学基金(06YY047)
- 作品数:1 被引量:6H指数:1
- 相关作者:李婷婷曾青青杨尔弘更多>>
- 相关机构:北京语言大学首都体育学院更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 事件信息结构分析被引量:6
- 2012年
- 该文通过考察事件词在文本篇章结构中的分布方式,指出突发事件新闻报道文本中包含主线信息链和副线信息链。主线信息链中包含了文本的事件信息,是事件信息提取重点考虑的文本内容部分;副线信息链则由文本结构中的"评价"、"背景"以及"情节"部分的细节信息等组成,是事件信息提取时可以忽略的文本内容部分。事件信息的结构可以进一步分解为前核心事件链、核心事件链、次生事件链和后次生事件链。该文通过定义事件词,以其为触发,探索了事件信息结构的识别与获取,并借助《知网》(HowNet)提高了事件词对信息刻画的有效性和区分度。
- 杨尔弘曾青青李婷婷
- 突发事件文本的信息结构分析
- 本文利用RST修辞结构理论研究了突发事件文本的结构关系,重点分析了突发事件类文本中五类主要的结构关系。同时对文本的信息构成作了探讨,分析了客观信息、主观信息以及模糊信息等三类信息,对这三类信息的分布比例也做了一定的研究。...
- 曾青青杨尔弘
- 关键词:突发事件修辞结构理论客观信息模糊信息
- 文献传递
- 以事件标注为核心的语篇标注研究
- 本文提出了一种以事件为基本单位对语篇进行人工标注的方法,探索了以事件为核心的语篇组织方式。从语篇的角度来看,其信息链可以通过事件及其事件之间的关系描述。本文对事件与事件关系的概念进行了探讨,确定语篇标注中事件关系的种类、...
- 邹红建杨尔弘
- 关键词:语篇
- 文献传递
- 事件词驱动的文本事件信息结构初探
- 本文结合戴伊克新闻文本的话语图式,以体现文本重要事件信息的事件词所分布的句子为观测点,指出了突发事件文本由主线信息链和副线信息链构成。其中,明确提出主线信息链代表了文本的事件信息结构,由前核心事件链、核心事件链、次生事件...
- 曾青青杨尔弘
- 文献传递
- 语篇标注中的事件标注研究
- 本文对表达事件的语篇,尝试以事件为基本单位进行标注,以事件标注为核心,探索语篇的标注。对事件这一概念进行探讨,进一步明确了语篇标注中事件的性质、事件模式的提取、事件的标注方法等。初步实验表明,以事件作为语篇标注的一个基本...
- 邹红建杨尔弘
- 关键词:语篇
- 面向内容计算的意义单元及其标注研究
- 本文对真实文本中表达意义信息的语言单位进行分析,确定了以意义单元作为语篇标注的基本单位,研究了这些意义单元在文本中表达信息的形式、类别、属性、关联方法等,初步确定了面向内容计算的文本标注内容、标注规范以及标注方法。
- 杨尔弘邹红建
- 关键词:语言资源
- 文献传递
- 事件预期属性的标注
- 事件属性信息对于精细刻画事件信息是必须的。本文对事件的预期属性这一新的事件属性进行分析,证明了预期属性是独立的事件属性,有必要进行相应的标注,并将之与相关范畴进行了区分,并分析了该属性出现的事件类别,以及表达该属性的语言...
- 邹红建杨尔弘
- 文献传递
- 基于信息结构的突发事件文本事件信息自动抽取策略研究
- 事件信息抽取是自然语言处理中一个较新的领域,汉语方面还有很大的研究空间。本文提出了一个以完整突发事件文本为处理对象的事件信息抽取策略。目前语义角色的识别和分类多是基于句子,针对一个完整语篇进行信息自动抽取更加复杂。我们的...
- 曾青青杨尔弘朱丹青
- 关键词:事件抽取信息结构
- 文献传递
- 事件标注及突发事件文本内容分析
- 本文在事件标注的基础上,对新闻报道中事件报道的组织方式进行分析,界定了文本的主副线信息链,对文本中机器可以识别的内容与难识别的内容进行了分析统计,是信息提取研究的基础工作。
- 曾青青杨尔弘
- 文献传递