您的位置: 专家智库 > >

国家重点基础研究发展计划(2004CB318102)

作品数:78 被引量:735H指数:15
相关作者:俞士汶彭爽吴云芳金晓艳穗志方更多>>
相关机构:北京大学南京师范大学南开大学更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>

文献类型

  • 78篇期刊文章
  • 26篇会议论文

领域

  • 61篇自动化与计算...
  • 39篇语言文字
  • 4篇文化科学
  • 1篇石油与天然气...
  • 1篇电子电信

主题

  • 21篇中文
  • 20篇信息处理
  • 20篇汉语
  • 18篇中文信息
  • 18篇中文信息处理
  • 15篇自然语言
  • 14篇消歧
  • 13篇计算机
  • 13篇计算机应用
  • 12篇语言处理
  • 12篇知识库
  • 12篇自然语言处理
  • 11篇语料
  • 11篇词义消歧
  • 10篇语料库
  • 9篇旁指
  • 8篇代词
  • 8篇语言知识库
  • 8篇现代汉语
  • 7篇语言学

机构

  • 81篇北京大学
  • 10篇南京师范大学
  • 8篇郑州大学
  • 6篇南开大学
  • 5篇北京语言大学
  • 4篇哈尔滨工业大...
  • 3篇东北师范大学
  • 3篇北京理工大学
  • 3篇香港理工大学
  • 3篇江苏省信息安...
  • 2篇大连医科大学
  • 2篇北京信息工程...
  • 2篇北京信息科技...
  • 2篇清华大学
  • 1篇吉林大学
  • 1篇金陵科技学院
  • 1篇西安外国语大...
  • 1篇中国科学院
  • 1篇菏泽学院
  • 1篇中央民族大学

作者

  • 34篇俞士汶
  • 12篇吴云芳
  • 12篇彭爽
  • 9篇曲维光
  • 8篇金晓艳
  • 8篇穗志方
  • 7篇刘耀
  • 7篇朱学锋
  • 7篇昝红英
  • 7篇段慧明
  • 7篇王治敏
  • 6篇张仰森
  • 5篇贾玉祥
  • 4篇柴玉梅
  • 4篇李素建
  • 4篇曾立英
  • 3篇于丽丽
  • 3篇王锦贵
  • 3篇王萌
  • 3篇曹元大

传媒

  • 19篇中文信息学报
  • 5篇语言文字应用
  • 5篇全国第八届计...
  • 4篇当代语言学
  • 3篇语言教学与研...
  • 2篇世界汉语教学
  • 2篇语文研究
  • 2篇计算机研究与...
  • 2篇计算机工程
  • 2篇情报杂志
  • 2篇小型微型计算...
  • 2篇术语标准化与...
  • 2篇南京师范大学...
  • 2篇第六届汉语词...
  • 1篇电子与信息学...
  • 1篇中国翻译
  • 1篇中央民族大学...
  • 1篇南京大学学报...
  • 1篇外语电化教学
  • 1篇现代外语

年份

  • 4篇2010
  • 19篇2009
  • 17篇2008
  • 18篇2007
  • 24篇2006
  • 22篇2005
78 条 记 录,以下是 1-10
排序方式:
现代汉语类词缀的定量与定性研究被引量:73
2008年
本文基于《现代汉语语法信息词典》8万词的词库,对类词缀的构词频率进行了统计和分析,同时也对类词缀的能产性、定位性以及虚化程度等构词特征进行了探讨,并区分了类词缀与部件词。我们采用定量研究和定性研究相结合的方法,对每一个类词缀从读音、义项、同形、词频、构词方式等方面进行全方位的考察,共确立了现代汉语的单音节类前缀23个、类后缀53个。
曾立英
关键词:类词缀
计算语言学与外语教学被引量:8
2006年
本文概要介绍计算语言学的基本概念及计算语言学对外语教学的意义和作用,希望为促进外语教学提供一些新的想法,同时也希望吸引更多外语教学研究者关注计算语言学,共同推动人类语言技术的进步。
俞士汶柏晓静
关键词:计算语言学外语教学语料库教育科技
旁指代词的连接功能考察被引量:1
2006年
本文对旁指代词“另”和“另外”的连接功能进行了详细的分析,并简要地探讨了旁指代词的连接功能在英语中的表现形式。
金晓艳彭爽
关键词:旁指代词
基于词频和语义信息的组合型歧义消解
组合型歧义切分是汉语自动分词的难点之一。本文挖掘歧义字段上下文的相对词频信息和语义信息,建立语境计算模型。首先基于相对词频比,建立RFRUM模型,其次采用类似K近邻的分类思想,利用知网,建立语义相似度计算模型,最后尝试两...
丁德鑫曲维光于丽丽陈小荷李惠
关键词:中文自动分词语境信息语义计算
文献传递
人民日报标注语料的索引方法研究
本文对人民日报标注语料的索引方法进行了研究,提出一种词语和标记的二元混合索引的方法,在可以同时检索词语和标记串的基础上,有效地提高了检索效率。
王洪俊施水才俞士汶肖诗斌
关键词:混合索引
文献传递
现代汉语虚词知识库的研究被引量:30
2007年
现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对真实语料中虚词用法规律的考察,着力构建面向机器的现代汉语虚词用法信息词典和虚词用法规则库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。
昝红英张坤丽柴玉梅俞士汶
关键词:计算机应用中文信息处理虚词语言知识库规则库
“像”的明喻计算被引量:8
2008年
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
李斌于丽丽石民曲维光
关键词:计算机应用中文信息处理
基于内容的名人网页褒贬性评价被引量:5
2005年
在已有基本褒贬义词典的基础上构建了一种可用于名人网页褒贬性评价的褒贬义词典,着重论述了网页褒贬性评价的模型、方法及工作流程,并提出了通过评价模板实现词典更新的初步构想。本系统基本实现了网页内褒贬词语的标注,并对部分名人网页进行褒贬性评价测试,取得了初步的成效。网页的褒贬评价可以嵌入到搜索引擎中,提供进一步的个性化服务。
熊德兰柴玉梅昝红英
面向中文学术专著的机器辅助翻译研究被引量:7
2006年
学术专著的对外传播对我国科学技术的发展意义重大。本文分析当前专著翻译工作中存在的问题和专著本身的特点,介绍一个面向中文学术专著的机器辅助翻译模型及其计算机辅助环境,用以细化专著翻译过程、规范人与计算机的分工与协作。实际应用的结果表明,该模型及辅助翻译系统能有效地提高专著翻译工作的自动化程度,保证专著翻译的效率和质量。
柏晓静俞士汶
关键词:翻译记忆双语语料库
面向自动文摘的文本结构划分被引量:3
2008年
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
朱荷香曲维光卢俊之李素建邵艳秋
关键词:文本结构自动文摘向量空间模型
共11页<12345678910>
聚类工具0