您的位置: 专家智库 > >

李玉梅

作品数:8 被引量:29H指数:3
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:语言文字自动化与计算机技术生物学更多>>

文献类型

  • 4篇期刊文章
  • 3篇会议论文
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 3篇语言文字
  • 1篇生物学

主题

  • 2篇信息处理
  • 2篇语料
  • 2篇语料库
  • 2篇评测
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇计算机
  • 2篇计算机应用
  • 2篇功能块
  • 1篇定语
  • 1篇形容
  • 1篇形容词
  • 1篇树库
  • 1篇歧义
  • 1篇歧义字段
  • 1篇字段
  • 1篇细胞
  • 1篇细胞分化
  • 1篇消解

机构

  • 5篇微软公司
  • 4篇清华大学
  • 4篇语言文字应用...

作者

  • 8篇李玉梅
  • 3篇黄昌宁
  • 2篇周强
  • 2篇姜自霞
  • 1篇靳光瑾
  • 1篇陈晓
  • 1篇易江燕

传媒

  • 2篇中文信息学报
  • 1篇中国语文
  • 1篇北京师范大学...
  • 1篇第十届全国计...
  • 1篇第五届全国语...

年份

  • 1篇2017
  • 2篇2010
  • 2篇2009
  • 3篇2007
8 条 记 录,以下是 1-8
排序方式:
形容词直接修饰动词的“a+v”结构歧义被引量:13
2009年
一般认为,定语是体词性中心语前边的修饰成分,状语是谓词性成分前边的修饰成分。近年来,形容词直接修饰动词的"a+v"词组大量涌现,如"大量研究、初步调查、重大调整、严格训练、严肃批评"等。它们究竟是状中结构还是定中结构,一般需依据上下文来判定。本文通过真实语料的实例分析了这种歧义结构的语法特点和分布,并建议把"a+v"定中词组中心语的词性标注为名词,即把"v"视为动、名兼类词。这样做的目的是让"定语"名正言顺地成为汉语"体词性中心语前边的修饰成分"。本文还对三个带标语料库进行了动、名兼类词的调查,动、名兼类的比例大约在7%(国家平衡语料库)到32%(北大语料库)之间,不会构成汉语"词无定类"的威胁。
黄昌宁姜自霞李玉梅
关键词:定语兼类词结构歧义
中文分词规范中的歧义字段消解细则
从1992年出版的《信息处理用现代汉语分词规范(GB/T 1375-92)》至今已有15个年头,经过国内外众多学者的努力,分词规范有了实质性的进步。当前,数百万词次的分词语料库经过人工审定后分词的出错率可以达到千分之一以...
李玉梅靳光瑾黄昌宁
关键词:歧义字段
Escargot和Scute调控肠道内分泌细胞分化的机制研究
果蝇肠道稳态由肠道干细胞(ISC)维持,ISC不断地增殖分化补充损伤脱落的上皮细胞。通常情况下,ISC分裂一次产生两个细胞,一个细胞维持ISC特性,另一个细胞分化为前体细胞(EB),进而分化为成熟的吸收型细胞(EC)和内...
李玉梅
关键词:DROSOPHILA肠道干细胞SCUTE
文献传递
汉语块分析评测任务设计
本文介绍了目前正在筹备的中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法,并通过相关统计数据分析和国内外相...
周强李玉梅
关键词:功能块
文献传递
汉语块分析评测任务设计被引量:9
2010年
该文主要介绍了目前中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法。然后给出了这三项目前的主要评测结果并对相关内容进行了简要分析。最后通过相关统计数据分析和国内外相关研究评述,总结了这三项评测任务的主要特色。
周强李玉梅
关键词:计算机应用中文信息处理功能块
从树库的实践看句本位和中心词分析法的生命力被引量:5
2010年
树库是一种带句法标注的语料库,它记录着真实文本中每个句子的句法分析结果——句法树。上世纪90年代,自然语言的自动句法分析再次成为国际计算语言学界关注的焦点,一个重要原因是美国宾州树库PTB的建成。根据树库自动归纳出来的概率型上下文无关语法,使英语的句法分析器在性能上显著超越了先前基于规则和合一运算的句法分析器。世界上为各种自然语言构建的树库,不论是短语结构树库还是依存结构树库,都以句子为基本的描述单位。依存语法是一种词例化语法,它不采用短语结构的语法概念,而直接描写句子中词与词之间的依存关系,即认为句子中任何两个具有依存关系的词中必有一个是中心词(支配词),而另一个是被支配词。因此,依存语法直接体现了一种语言的句法层面和语义层面之间的天然联系。这充分说明,黎锦熙先生在《新著国语文法》中倡导的句本位语法体系和中心词分析法具有鲜活的生命力。它们不仅在我国解放前后的中学语文教学中数十年长盛不衰,而且至今仍在指导着树库的建设和应用。
黄昌宁李玉梅
关键词:句本位树库
分词规范亟需补充的三方面内容被引量:2
2007年
本文认为,为提高语料库的分词标注质量应在分词规范中补充三个内容:①命名实体(人名、地名、机构名)标注细则;②表义字串(日期、时间、百分数等)标注细则;③歧义字串的消解细则。因为一方面命名实体和表义字串已被不少分词语料库视为分词单位,另一方面在以往的分词规范中几乎从不谈及歧义消解问题。其实人们对歧义字串的语感往往是不同的。因此有必要在规范中对典型的歧义字串予以说明。实践表明,在规范中交待清楚以上三方面内容,就可以在很大程度上避免标注的错误和不一致性。
李玉梅陈晓姜自霞易江燕靳光瑾黄昌宁
关键词:计算机应用中文信息处理语料库
分词规范亟需补充的三方面内容
本文认为,要构建高质量的分词语料库亟需在现有的分词规范中着重补充以下三方面的内容:①命名实体 (人名、地名、机构名)标注细则;②表义字串(数字、时间、日期、电子邮箱等)标注细则:③歧义字串的消解细则。因为命名实体和表义字...
李玉梅陈晓姜自霞靳光瑾易江燕黄昌宁
关键词:语料库
文献传递
共1页<1>
聚类工具0