国家自然科学基金(60573185)
- 作品数:10 被引量:111H指数:7
- 相关作者:周强袁毓林陈振宇张秀松李湘更多>>
- 相关机构:清华大学北京大学复旦大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字哲学宗教更多>>
- 从认知假设到计算分析和程序实现——一种认知语言学研究的计算范式与技术路线被引量:5
- 2010年
- 本文展示一种认知语言学研究的计算范式与技术路线:首先基于语言使用是一种以知识为基础的认知过程的假设,以计算机模拟人类理解自然语言的意义为技术背景,用情境网络对特定领域的有关语言表达及其意义进行认知建模;再用逻辑表达式刻画关键性的情境要素之间的语义关系,并用语义公理来表示有关逻辑表达式之间的推导关系,从而形成概念层面的知识推理和语义计算的知识单元;然后,为有关语言现象建立词汇句法知识库,从词汇、语义和句法分布等方面对跟有关情境相对应的词汇和句式进行详细的描写,并且在情境网络、词汇—句法知识库和真实文本中的有关描述实例之间建立双向联系;最后,形成完整的词汇语义计算的知识平台,再应用到有关的自然语言处理系统中。文章还通过"领属转移"这个实例,对情境网络和词汇句法知识库的开发过程进行简要的说明;通过"亲属关系的自动推理"这个专家系统的研究和开发过程,对认知模型和情境网络、逻辑表示和语义公理、词汇—语义—句法知识库的建立、乃至算法设计和程序实现的全过程进行例示。
- 袁毓林陈振宇张秀松李湘周强高嵩
- 关键词:程序实现
- 现代汉语存现句研究综述被引量:8
- 2007年
- 以往学者们关注的中心是存现句的范围和分类,近些年许多学者,尤其是海外学者开始用生成语法的框架讨论存现句,对汉语存现句的生成过程作了很有益的探讨。
- 王健
- 关键词:存现句论元增容
- 基于层式有限状态自动机的灾难事件抽取系统
- 本文首先介绍了信息抽取技术的现状和灾难性事件信息抽取方面目前取得的成果,并介绍了一种基于层式有限状态自动机的灾难性事件信息抽取系统,最后给出了系统的实验结果。在此系统中利用框架结构和三层的层式自动机,对灾难性事件进行信息...
- 钟涛陈群秀
- 关键词:信息抽取正则表达式
- 文献传递
- 一种基于大知识库的亲属关系自动推理模型被引量:8
- 2010年
- 我们采用"大知识库—小运算"的技术路线,提出一个汉语亲属关系的自动推理模型。首先,在充分研究汉语亲属关系的词汇—语法表达的基础上,给汉语常见的亲属关系及其情景语义建立认知模型。然后,据此构造大型的汉语亲属关系知识库,包括外围知识库和核心知识库两种。前者详尽列举亲属名词和称呼动词所涉及的各种句式,并给出相应的语义表达式;后者包括三个子库:性质库(刻画亲属关系中的性别、长幼等属性)、逆判断库(刻画"父—子"等反对称关系对子)和传递库(刻画通过中介人把称呼人与被称呼人联系起来的各种路径,共计3 600余条)。在此基础上,形成了一个汉语亲属关系自动推理模型,可以在已知ABC三边关系的任意两边时快速地推导出未知的另一边关系。
- 陈振宇袁毓林张秀松周强
- 关键词:计算机应用中文信息处理亲属关系知识库
- 亲属关系的逻辑意义及其自动推理被引量:8
- 2009年
- 用一阶谓词逻辑设计了一个亲属关系的自动推理模型。首先,把亲属关系(称谓)视为谓词,相关的人物视为变元,把亲属关系和有关性质用"或"、"与"及"逆"等运算符号联结成亲属关系表达式。然后,选取11种基本的亲属关系作为亲属基元,并构造亲属基元转换和化简的九大定理,用以描写和定义其他一百多种亲属关系,从而形成亲属关系转换的核心知识库。最后,给出一种简洁的亲属关系转换算法,主要包括连接、求逆、化简和组配等运算。
- 陈振宇袁毓林张秀松周强
- 关键词:一阶谓词逻辑亲属关系求逆化简
- 一种中文分词后处理反馈算法
- 分词错误会对未登录词识别产生严重干扰。为解决该问题,本文提出一种对分词结果中的未登录词进行分类,获取分词结果中未登录词的可信度,并将结果反馈至分词程序的算法。分词程序可以据此判断是否应当重新进行分词。实验结果表明算法作为...
- 高嵩周强
- 关键词:自动分词未登录词识别
- 汉语功能块自动分析
- 汉语功能块描述了句子的基本骨架,是联结句法结构和语义描述的重要桥梁。本文通过对功能块描述特点的深入分析,提出了两种不同分析模型:边界识别模型和序列标记模型,并使用不同的机器学习方法进行了计算模拟。通过两种模型分析结果的有...
- 周强赵颖泽
- 文献传递
- 基于Web主题性信息检索的灾难性事件信息抽取系统
- 本文介绍了一种以灾难性事件为研究背景,综合信息检索、Web 挖掘等多方面知识的灾难性事件信息抽取系统。系统采用了对网页 URL 相关度评价的收集机制,以框架结构作为信息抽取的工作基础,对灾难性事件进行信息抽取。实验表明这...
- 钟涛陈群秀
- 关键词:信息抽取有限状态自动机相关度
- 基于情境网络的汉语亲属名词的语义描写体系被引量:5
- 2011年
- 本文借鉴生成词库论关于物性结构的观念,提出亲属名词的社会结构的概念,从而形成一套对汉语亲属名词进行语义描写的形式化体系。这个体系包括亲属名词的词条说明、社会角色、社会结构(即语义结构)和它所激活的情境网络四个方面。文章指出,亲属名词的词典释义应尽可能反映促动亲属名词语义结构的形成的概念结构。这个概念结构的主体是认知主体识别亲属词的所指时搜索指针所经历的搜索路径。它是一种以各种亲属关系作基底,以称呼角色、受呼角色和中介角色等社会角色作侧面,以受呼角色作焦点的认知图式。亲属名词的词典释义还应尽可能反映出相关社会角色在性别、年龄等属性参数上的取值,基元性亲属名词的释义应尽量避免同义互释或转释。计算机编程实验表明,本体系对于计算机模拟人脑进行亲属关系的模板匹配,从而计算和推导亲属关系具有直接的应用价值。
- 张秀松袁毓林陈振宇周强
- 关键词:亲属关系社会结构社会角色
- 《知网》语义关系图的自动构建被引量:5
- 2008年
- 在真实语言环境中,词语间的联系普遍存在、错综复杂。为了更好融合和使用各种语义资源库中的语义关系,构建可计算的汉语词汇语义资源,该文提出了通过构建语义关系图整合各种语义资源的方法,并在《知网》上实现。《知网》作为一个知识库系统,对各个词语义项是以分条记录的形式存储的,各种词汇语义关系隐含在词典文件和义原描述文件中。为提取《知网》中语义间的关系,本文首先将《知网》中的概念以概念树的形式重新表示,并从概念树中提取适当的语义关系,构建语义关系图。经过处理,得到88种589 984条语义关系,图上各种节点具有广泛的联系,为基于语义关系图的进一步分析和计算打下了基础。
- 王宏显周强邬晓钧
- 关键词:计算机应用中文信息处理概念树《知网》