国家高技术研究发展计划(2007AA01Z173)
- 作品数:14 被引量:70H指数:6
- 相关作者:周强袁毓林陈振宇张秀松亢世勇更多>>
- 相关机构:清华大学北京大学鲁东大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- RefRank:一种基于内容引用的搜索引擎排序算法
- 本文介绍了一种搜索引擎根据搜索结果网页中的相互引用现象对其进行排序,将包含较多与查询相关信息的网页放在前面的算法。本方法认为在网络上传播越广泛的信息越重要、越有效。本方法通过查找网页集合中相互引用的部分,给予包含大量引用...
- 高嵩周强
- 文献传递
- 一种基于句子分割的文法自动推导算法
- 信息咨询口语对话系统中的领域文法规则往往需要专家来人工设计。本文针对一种面向汉语口语的上下文无关增强文法,提出了一种基于句子分割的文法自动推导算法。其基本思想是:用初始规则集对训练例句进行分析,若不能得到完整的语法树,则...
- 张合邬晓钧王晓东郑方
- 关键词:口语对话系统
- 文献传递
- 拥有情境的例化及其汉语实现被引量:1
- 2008年
- 在人们的认知中,拥有情境可以例化为领有情境、存有情境、互有情境和具有情境等不同的子情境。拥有结构在激活这些不同的子情境时会例化为不同的子结构。这些"拥有子结构"具有各不相同的句法语义属性。比如,在能否转换为处置式、能否实现"有者提升"、能否转换为存在句等方面各不相同。
- 张秀松
- 关键词:子结构
- 一种基于句子分割的文法自动推导算法被引量:1
- 2009年
- 信息咨询口语对话系统中的领域文法规则往往需要专家来人工设计。该文针对一种面向汉语口语的上下文无关增强文法,提出了一种基于句子分割的文法自动推导算法。其基本思想是:用初始规则集对训练例句进行分析,若不能得到完整的语法树,则先对分析结果进行消歧和归一化,然后根据顶层成分递归地推导出缺少的规则,并更新已有的规则集。为了提高最终文法的性能,在例句处理顺序和规则更新上对算法基本流程做了改进。在天气预报查询领域进行了实验,结果文法的句法分析准确率在初始规则集为空时达到了64.8%,在初始规则集只包含日期相关规则时达到了86.4%。
- 张合邬晓钧王晓东郑方
- 关键词:口语对话系统
- 语义角色句法实现的词汇语义制约信息库的建设及其应用
- 词汇语义制约了语义角色的句法实现。我们以语义角色为纲、以句中动词为中心,抽取了标注信息比较成熟的《中小学语文课本标注语料库》中必有论元块的核心词,在标注义类、句法语义格式等信息的基础上建立了《语义角色句法实现的词汇语义制...
- 周明海亢世勇
- 关键词:语义角色句法成分词汇语义信息库
- 文献传递
- 基于多部词典的目标动词义项标注的困难及解决策略
- 2011年
- 大规模、高质量的词义标注语料库是重要的语义资源,是词义消歧的关键,也是事件内容信息分析的训练和测试语料库,基于多部词典的目标动词义项标注是一种新的尝试,有成功之处,亦有很多困难。本文在人工标注的由119个目标动词、29626个句子组成的语料库的基础上,主要研究了基于多部词典的目标动词义项标注的困难,并根据这些困难提出具体的解决策略。
- 周明海亢世勇王莉
- 汉语亲属关系的语义表示和自动推理被引量:11
- 2010年
- 我们通过对汉语亲属词语的语义特征和语义关系进行分析,用一阶谓词逻辑设计了一个亲属关系的语义表示和自动推理模型。首先选取七种语义特征作为描写和定义所有亲属关系的基础,并把这些语义特征视为谓词,把相关的人物视为变元;然后将特定亲属关系的语义特征用运算符号"或"、"与"联结成逻辑表达式;最后给出一种简洁的亲属关系转换算法,包括四个运算步骤:1)把两个已知亲属关系的逻辑表达式联结在一起;2)使用辅助运算规则把表达式中蕴含的信息全部找出来;3)使用化简运算规则把表达式转化为最简表达式;4)从最简表达式上进行归结从而获得答案。
- 陈振宇袁毓林
- 关键词:语义特征亲属关系一阶谓词逻辑
- 汉语基本块标注系统的内部关系分析被引量:8
- 2009年
- 针对目前基本块分析主要侧重外部边界和句法标记识别的处理缺陷,提出了一种可以同时获得基本块的外部句法标记和内部关系描述的汉语基本块分析方法。首先通过设计关系标记集来描述基本块内部词与词之间的句法依存关系,然后利用统计建模对句子中的每个词进行序列关系标注,最后通过有限自动机规则自动获取句子的完整基本块标注结果。实验结果表明,与使用经典的边界标记(IOB)模型进行基本块句法标注分析的方法相比,该方法在句法标记识别性能略有下降的情况下获得了很好的内部关系分析结果。
- 宇航周强
- 关键词:中文信息处理统计模型
- 构建大规模的汉语事件知识库
- 随着互联网的迅猛发展,大量的信息以文本的形式快速涌现。对海量文本进行信息的深度挖掘离不开高质量的事件内容分析技术,而这些技术的开发又需要高质量的事件语义标注资源支持。本文提出了一个构建大规模汉语事件知识库的可行方案。实验...
- 周强王俊俊陈丽欧
- 文献传递
- 一种基于大知识库的亲属关系自动推理模型被引量:8
- 2010年
- 我们采用"大知识库—小运算"的技术路线,提出一个汉语亲属关系的自动推理模型。首先,在充分研究汉语亲属关系的词汇—语法表达的基础上,给汉语常见的亲属关系及其情景语义建立认知模型。然后,据此构造大型的汉语亲属关系知识库,包括外围知识库和核心知识库两种。前者详尽列举亲属名词和称呼动词所涉及的各种句式,并给出相应的语义表达式;后者包括三个子库:性质库(刻画亲属关系中的性别、长幼等属性)、逆判断库(刻画"父—子"等反对称关系对子)和传递库(刻画通过中介人把称呼人与被称呼人联系起来的各种路径,共计3 600余条)。在此基础上,形成了一个汉语亲属关系自动推理模型,可以在已知ABC三边关系的任意两边时快速地推导出未知的另一边关系。
- 陈振宇袁毓林张秀松周强
- 关键词:计算机应用中文信息处理亲属关系知识库