教育部人文社会科学重点研究基地度重大研究项目(10JJD740012)
- 作品数:3 被引量:25H指数:3
- 相关作者:胡金柱雷利利陈江曼舒江波杨进才更多>>
- 相关机构:华中师范大学湖南省第一师范学院更多>>
- 发文基金:教育部人文社会科学重点研究基地度重大研究项目国家社会科学基金国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 关联词搭配的自动发现被引量:12
- 2011年
- 提出了关联词搭配模式自动发现的基本方法。建立一个大规模语料库,然后作分词处理,并对关联词进行自动标注和人工校对;评估关联词搭配的三个重要参数(搭配距离、搭配强度MI值、搭配强度Z值),并设定阈值,超过阈值的格式自动作为候选搭配模式。通过实验,标注的准确率为88.75%,表明本方法具有较好效果。运用该方法,发现了以往大量未被注意的句法搭配模式,对研制高质量的关联词知识库起到了积极的促进作用,对复句句法、语义的自动分析具有重要的意义。
- 姚双云胡金柱肖升沈威
- 关键词:语料库关联词搭配
- 多重复句关系标记搭配的求解模型研究被引量:4
- 2011年
- 关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。
- 胡金柱雷利利杨进才舒江波陈江曼
- 关键词:多重复句
- 基于规则的连用关系标记的自动标识研究被引量:15
- 2012年
- 复句中的关系词对研究复句中各分句的语义关系有着重要意义,但在基于规则的关系词自动识别的研究中发现,并非复句中出现的关系标记都是关系词,从中识别出真正的关系词是研究的重点和难点。提出对一种典型的关系标记——位置相邻的关系标记进行自动标记的算法,该算法结合关系词库和关系词提取技术,分析其连用特征。实验表明,该算法对连用关系标记的标识准确率达到72.9%。
- 胡金柱陈江曼杨进才舒江波雷利利