国家自然科学基金(60873173)
- 作品数:3 被引量:12H指数:2
- 相关作者:周强李玉梅王俊俊陈丽欧邱晗更多>>
- 相关机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 构建大规模的汉语事件知识库
- 随着互联网的迅猛发展,大量的信息以文本的形式快速涌现。对海量文本进行信息的深度挖掘离不开高质量的事件内容分析技术,而这些技术的开发又需要高质量的事件语义标注资源支持。本文提出了一个构建大规模汉语事件知识库的可行方案。实验...
- 周强王俊俊陈丽欧
- 文献传递
- 汉语块分析评测任务设计
- 本文介绍了目前正在筹备的中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法,并通过相关统计数据分析和国内外相...
- 周强李玉梅
- 关键词:功能块
- 文献传递
- 汉语块分析评测任务设计被引量:9
- 2010年
- 该文主要介绍了目前中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法。然后给出了这三项目前的主要评测结果并对相关内容进行了简要分析。最后通过相关统计数据分析和国内外相关研究评述,总结了这三项评测任务的主要特色。
- 周强李玉梅
- 关键词:计算机应用中文信息处理功能块
- 构建大规模的汉语事件知识库被引量:2
- 2012年
- 该文提出了一种静态知识库和动态标注库相结合的汉语事件知识库构建方法。在统一的设计框架下,将相关事件知识拆分成五个相对独立的知识子库,并通过各子库之间的内在联系使之互相参照互为补充。经过有效拆分和信息联动,增强信息的丰富性和可靠性,同时细化工作的粒度,具有较好的可操作性。以此为基础,开发完成一个汉语"存在拥有类"事件知识库,其中静态知识库覆盖72个情境和1 548个词语义项,动态标注库包含598个事件目标动词的10万句标注结果,取得了较好的实验效果。
- 周强王俊俊陈丽欧
- 自动获取大规模的汉语紧密组合词汇关联对被引量:1
- 2011年
- 词汇关联对(lexical cohesion pairs,LCP)是真实文本中出现的反映不同句法语义关联关系的实词组合对。可靠的词汇关联对可以在汉语文本的复合词分析、句法结构排歧、远距离依赖识别和语义排歧等研究中发挥重要作用。该文提出了一种将基本块分析和统计筛选相结合的处理方法,保证在较高的提取精度条件下,尽可能多地从大规模真实文本语料库中自动获取较可靠的汉语紧密组合词汇关联对。在约4 000万字规模的人民日报词语切分和词性标注库上进行的关联对获取实验结果表明:该方法可以在废弃35.6%的有效分析信息条件下,自动提取出约73万个汉语名和动名关联对,抽样提取精度达到了96%左右,显示了较好的处理效果。
- 邱晗周强
- 关键词:文本挖掘知识获取
- 自动获取大规模的汉语紧密组合词汇关联对
- 词汇关联对(1exical cohesion pairs,LCP)是真实文本中出现的反映不同句法语义关联关系的实词组合对。可靠的词汇关联对可以在汉语文本的复合词分析、句法结构排歧、远距离依赖识别和语义排歧等研究中发挥重要...
- 邱晗周强
- 关键词:文本挖掘知识获取
- 文献传递
- 句法特征在动词词义排歧中的应用
- 特征选取是用统计方法进行词义排歧的关键。本文通过句法块的分析结果,将主语和宾语、以及主语和宾语在知网中的归类信息应用于目标动词的词义排歧。实验表明,句法特征对于目标动词的词义排歧有重要作用,相对于仅使用词语和词性特征的系...
- 王宏显周强
- 关键词:句法特征词义排歧最大熵主语宾语
- 文献传递
- 复杂名词短语中的语义角色自动标注研究
- 汉语句子中包含谓词的名词短语表述的事件关系能够为理解整个句子的意义提供更细致的信息。针对汉语中该类表述事件关系的名词短语,本文提出了一个利用汉语句法结构与语义结构对应关系知识进行语义角色自动标注的方法。本文研究中分析了真...
- 李丽
- 文献传递