中国科学院声学研究所知识创新工程项目(无)
- 作品数:8 被引量:22H指数:2
- 相关作者:张全缪建明吴晨韦向峰熊亮更多>>
- 相关机构:中国科学院中国科学院研究生院中国科学院大学更多>>
- 发文基金:中国科学院声学研究所知识创新工程项目国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 语义理解下的自然语言处理及信息检索模型被引量:7
- 2008年
- 本文从如何利用语义来构建理想信息检索系统的角度出发,以HNC自然语言理解体系为基础,给出了一种在这一体系下分步构建信息检索系统的实施方案。结合HNC在信息检索方面新近取得的研究成果,从理论和工程两个角度介绍了这一体系服务于信息检索的相关内容,讨论了其中几个重要模型的实现方法。最后沿着方案思路给出了在目前成果基础上进一步发展检索系统的展望。
- 吴晨张全缪建明韦向峰
- 关键词:信息检索自然语言理解语义HNC
- 跨语种信息检索中的文本比较及结果生成算法被引量:1
- 2005年
- 提出了一种基于语义的跨语种信息检索中的文本比较及结果生成的算法,算法从语义入手,以形式化的语境单元框架结构来表示被检索的内容和检索请求,它从文本语义表示的三个方面:领域(静态范畴)、情景(动态范畴)、背景(参照)来对检索请求和被检索文档数据之间的语义相关度进行计算和排序,根据建立在语境单元框架上的语义符号间的匹配和生成机制来实现文本检索。与传统CLIR技术相比,它可以避免以语言空间中的词语作为检索的中间量而带来的语义模糊。实验证明,这一算法在解决基于语义的跨语种信息检索中的文本比较和结果生成上具有良好的处理能力。
- 吴晨缪建明张全
- 关键词:语义相关度
- 自然语言语义理解下的信息检索模型
- 为了提升信息检索系统性能,语义学被引入了传统基于概率统计算法的检索模型之中,本文将沿着这一思路,以 HNC自然语言理解体系为基础,阐述HNC理论下,引入语义知识,逐步构建检索系统的策略。并结合已经取得的部分研究成果对这一...
- 吴晨张全缪建明韦向峰
- 关键词:信息检索自然语言处理语义概念层次网络
- 文献传递
- 单字动词的组合处理研究
- 从词汇层面来看,汉语处理的难点之一是词语边界模糊。而汉语中的单字词处理,则是这一难点中的难点。其根源在于,汉语单字词的意义复杂,义项很多。而汉语单字词具有很强的组合特征.在组合形成的多字结构中,单个汉字的语义模糊大大减少...
- 孙雄勇张全
- 关键词:HNC
- 文献传递
- 汉语语句形式结构到语义结构的理解自明度被引量:1
- 2006年
- 计算机理解语句的方法之一是从形式结构出发得到语义结构。本文从计算机的角度给出了语句形式结构的表示方法,基于概念层次网络理论说明了语句语义结构的描述单位,介绍了从语句形式结构得到语句语义结构的分析方法。用理解自明度来反映分析结果的可靠性,并给出了描述分析过程中各子过程的理解自明度的计算公式。理解自明度是衡量系统分析性能的一个重要指标,也有助于系统解模糊能力的改进和提高。
- 韦向峰张全熊亮
- 关键词:语义结构
- 现代汉语主谓谓语句的HNC处理研究被引量:2
- 2006年
- 主谓谓语句是汉语特有的语言现象,主谓结构做谓语的格式也是汉语最常见、最重要的句式,也是汉语区别于印欧语的重要句式之一。现代汉语语法对这种特殊句式进行了深入的研究,在语法、语义等方面取得了长足进展。本文尝试在HNC理论的总体框架下,对这一特殊句式展开全面、系统的解释,并从计算语言学的角度形成特有的处理规则,便于计算机在原始语料中发现这类语句,最终形成针对主谓谓语句的专家处理系统。
- 缪建明张全
- 关键词:主谓谓语句HNC理论语义块语句格式
- 汉语句间成分共享类型及分布研究被引量:2
- 2007年
- 自然语言中语句之间经常出现句子成分共享的情况。本文以计算语言学理论为指导,首先明确了便于计算机自动处理的句子和句群的定义。以此为基础,获得了真实语料中句群单位内相关数据的统计结果。进而依据语句的定义分析了语句之间语义块共享的类型,给出了语句间语义块共享的具体分类,统计了真实语料中各共享类型的分布数据。同时本文还对统计数据进行了分析,统计结果符合常人对语料的直觉定性判断。本文的结果有助于语句之间成分共享和句群的计算机自动分析。
- 张全吴晨韦向峰
- 关键词:中文信息处理自然语言理解
- 基于概念树的文本自动分类系统的研究与实现被引量:7
- 2005年
- 该文分类是信息处理的重要研究方向,现在应用较多的都是基于统计的分类系统,本文介绍了一种新型的文本分类理念,通过概念符号化,使用数字化的概念而非词汇来组成特征项,能最大限度地保留文本信息,且不需要训练语料,能灵活适应不同的分类体系。接下来详细描述了领域特征信息提取的4个步骤,以及分类体系的选取与设计。最后给出了实验的测试数据,并对影响性能的一些关键因素进行了分析,指出了进一步提高分类性能的途径。
- 熊亮
- 关键词:文本分类概念树概念层次网络
- 一种基于HNC理论的领域知识表示研究
- 领域句类是HNC理论根据不同语境类别——领域所蕴含的世界知识抽象得到的语句级概念联想脉络,它具有自己的句类代码和表示式,通过特定的领域词语可激活对相关领域的联想。领域句类的设计是语境单元萃取技术中不可或缺的环节, 为语境...
- 缪建明吴晨郝惠宁张全
- 关键词:HNC理论
- 文献传递
- 信息检索中的广义作用效应链应用研究
- 2009年
- 广义作用句和广义效应句的划分是作用效应链思想在句类体系中的体现。这一划分是对自然语言语句的一个最基本的分类。如果结合信息检索中采取的统计学办法,在检索结果的基础上进行二次精筛选,则提供给查询用户的结果必将更符合实际需求,能更有效提高信息检索的正确率。从人为数据统计结果来看,这一思路有效地把统计方法和基本规则方法结合起来,提高了信息检索的检索准确率。
- 缪建明张全
- 关键词:HNC理论