尚英
- 作品数:16 被引量:41H指数:4
- 供职机构:北京语言大学信息科学学院更多>>
- 发文基金:国家自然科学基金教育部科学技术研究重点项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- VV与V一V式动词重叠的特征调查研究
- 尚英
- 文献传递
- 从广义话题结构考察汉语篇章话题认知复杂度被引量:10
- 2014年
- 语言理解问题从认知的角度已有大量的研究,但针对汉语的研究却很少。由于认知实验操作复杂,不容易大规模复制,因此难以量化其结论的普遍性以及对语言事实的覆盖度。该文尝试模拟人补足汉语篇章片段中话题-说明信息的过程,建立广义话题结构认知机模型,并通过认知机对大规模汉语语料进行定量分析,考察汉语标点句的话题认知所需的记忆资源及认知局限性。用作统计特征量的广义话题结构特征有标点句的深度、话题结构内折返度、话题栈深度、话题栈折返度、搁置区使用量。统计数据可从认知行为的视角得到合理解释。该文一方面揭示了说汉语者的话题认知能力的表现和局限性,另一方面又说明了广义话题结构认知机是话题认知的合理模型。
- 卢达威宋柔尚英
- 关键词:汉语篇章
- 广义话题结构理论视角下话题自足句成句性研究被引量:4
- 2014年
- 话题自足句是在广义话题结构理论的基础上定义的。话题自足句的成句性是广义话题结构的重要性质之一。该文在38万字不同语体的广义话题结构语料库中对话题自足句的成句性进行了实证性调查,发现有少量话题自足句不成句,对不成句现象进行了分析、分类,并提出了使其成句的办法。这将进一步完善广义话题结构理论,并能提高使用话题自足句的应用系统的性能。
- 尚英宋柔卢达威
- 《中国大百科全书》人物传记知识提取加工规范
- 将百科辞典中的知识形式化,是使用计算机进行知识服务的根本基础。目前的主要方法是在人工建立语言知识库的基础上计算机对于词条释文进行句法语义分析,或者直接由知识专家对词条释文进行形式化改写。这两种方法都需要大量的高级人力的投...
- 颜伟王洁尚英宋柔
- 关键词:人物传记知识提取
- 文献传递
- 简单短语及线性邻接属性研究
- 简单短语是从计算机处理汉语的使用需求出发提出的概念,是较易自动识别、较高频、类内语法功能相似的若干类词组。本文界定简单短语的概念,给出了简单短语类的草拟清单,并提出用线性邻接关系表现简单短语的语法特征,使词和词组能在同一...
- 宋柔尚英赵瑾
- 面向文本信息处理的汉语句子和小句被引量:11
- 2017年
- 小句和句子分别是篇章信息处理的基本单位和复合单位。但是汉语中,这两个概念至今未有公认的适用于语言信息处理的界定,这种状况阻碍了汉语信息处理的发展。该文将汉语的句子大致界定为自足的广义话题结构,把小句界定为基于广义话题结构的话题自足句,并提出了这样界定的语言学依据和认知依据。
- 宋柔葛诗利尚英卢达威
- 关键词:句子小句
- 基于大规模调查的动词重叠形式自动识别方法与形式特征研究
- 动词重叠在现代汉语中是一种常见的语法现象,传统语言学领域对动词重叠进行过大量研究,但调查规模比较小,并且侧重于语法意义的研究。汉语教学、汉语研究、汉语信息处理都需要更大规模地调查研究动词重叠的形式特征。对动词重叠形式的计...
- 尚英
- 关键词:动词重叠自动识别语法特征
- 文献传递
- 简单短语及线性邻接属性研究
- 简单短语是从汉语处理的使用需求出发提出的概念,是较易自动识别、较高频、类内语法功能相似的若干类词组。本文界定了简单短语的概念,给出了简单短语类的草拟清单,并提出用线性邻接关系表现简单短语的语法特征,使词和词组能在同一个体...
- 宋柔尚英赵瑾
- 文献传递
- 《中国大百科全书》中行政地理知识的人工提取规范
- 文本知识提取是语言信息处理的一个重要内容。我们工作的目标是用计算机自动提取百科全书中有形式特征的显性知识。为此,需要先进行人工提取,为机器自动提取知识做准备。本文主要介绍了我们的知识提取工作的总体思路,并且选择了其中的行...
- 尚英宋柔
- 关键词:知识提取复杂知识
- 文献传递
- 汉语篇章广义话题结构理论的实证性研究
- 尚英