您的位置: 专家智库 > >

吴云芳

作品数:50 被引量:339H指数:13
供职机构:北京大学更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 37篇期刊文章
  • 10篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 36篇自动化与计算...
  • 18篇语言文字

主题

  • 14篇汉语
  • 11篇信息处理
  • 11篇消歧
  • 11篇词义消歧
  • 10篇中文
  • 8篇中文信息
  • 8篇中文信息处理
  • 6篇语义
  • 6篇句法
  • 6篇词义
  • 5篇语料
  • 5篇语料库
  • 5篇句法分析
  • 4篇语词
  • 4篇语言处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇向量
  • 4篇机器翻译
  • 4篇汉语词

机构

  • 49篇北京大学
  • 9篇北京信息科技...
  • 2篇郑州大学
  • 1篇北京城市学院
  • 1篇哈尔滨工业大...
  • 1篇鲁东大学
  • 1篇西安外国语大...
  • 1篇乐山师范学院
  • 1篇中国标准化研...
  • 1篇拓尔思信息技...

作者

  • 49篇吴云芳
  • 9篇俞士汶
  • 7篇张仰森
  • 4篇金澎
  • 3篇吕学强
  • 3篇万富强
  • 3篇段慧明
  • 3篇穗志方
  • 3篇石静
  • 2篇李炜
  • 2篇亓文法
  • 2篇段惠明
  • 2篇常宝宝
  • 2篇昝红英
  • 2篇裴雨来
  • 2篇徐艺峰
  • 2篇邵艳秋
  • 1篇乔春庚
  • 1篇张良
  • 1篇张良

传媒

  • 12篇中文信息学报
  • 4篇当代语言学
  • 4篇语言文字应用
  • 2篇计算机研究与...
  • 2篇北京大学学报...
  • 2篇电子学报
  • 2篇术语标准化与...
  • 1篇语文研究
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇语言研究
  • 1篇计算机工程与...
  • 1篇中国科技成果
  • 1篇语言科学
  • 1篇标准科学
  • 1篇第二届全国信...
  • 1篇第三届HNC...
  • 1篇第六届汉语词...

年份

  • 1篇2023
  • 1篇2022
  • 2篇2021
  • 1篇2020
  • 2篇2019
  • 2篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 3篇2013
  • 3篇2011
  • 3篇2010
  • 3篇2009
  • 3篇2008
  • 2篇2007
  • 1篇2006
  • 7篇2005
  • 3篇2004
  • 5篇2003
  • 3篇2002
50 条 记 录,以下是 1-10
排序方式:
动词性并列结构的结构平行被引量:6
2004年
本文讨论了动词性并列结构的结构平行特征:状中结构的不平行,述宾结构的平行,主谓结构的平行,音节数目的相同。可用一个复杂特征结构来描述动词短语,包括两个属性特征“结构和音节”,其中“结构”又有两个取值“述宾和主谓”。对两个动词短语,只要其中的一个属性特征相同(结构或者音节)就可形成并列。动词性并列结构表现出来的平行性可以帮助计算机自动识别并列结构的边界。
吴云芳
关键词:现代汉语动词短语状中结构
HPSG理论简介被引量:12
2003年
本文概要介绍了HPSG理论(中心语驱动短语结构语法)。表层导向、基于约束和词汇主义是HPSG的主要理论主张;特征结构是HPSG描述语法信息的主要手段,词汇类体系结构和词汇规则构成了HPSG的词汇体系;中心语——补足语规则、中心语——指定语规则等以及中心语特征原则、值传递原则等构成了HPSG的规则系统。文章最后对HPSG和GB理论进行了简要的比较。
吴云芳
关键词:句法理论计算语言学特征结构词汇
汉英双语短语信息数据库的构建
本文扼要介绍了一个汉英双语短语信息数据库的构建情况:汉语短语的描述信息;英语短语的描述信息:描述中的疑难问题;短语库的实施和应用。短语库是综合型语言知识库的有机组成部分,它的建设将为短语结构研究、句法分析和机器翻译提供强...
吴云芳常宝宝詹卫东
关键词:短语结构机器翻译
文献传递
动词对宾语的语义选择限制被引量:31
2005年
动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限制,归纳成5种类型,在此基础上讨论了语义选择限制在汉语信息处理中的应用和局限,并进而讨论了上下位语义关系、部分整体语义关系在动词语义选择限制中的作用。
吴云芳段慧明俞士汶
关键词:语义关系词义消歧
汉语词义自动标注研究软件平台的设计与实现
词语义项标注在自然语言处理领域占有重要地位.词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大.为更好地研究这些问...
张仰森俞士汶段惠明吴云芳
关键词:知识获取
文献传递
“和”“与”“并”“而”连接谓词性成分时的区别被引量:15
2005年
并列连词“和”“与”“并”都可以连接动词性成分 ,“和”“与”“而”都可以连接形容词性成分 ,但它们在句法位置的分布上显现出差异 ,这种差异可以从“表述功能”得到合理的解释 :“和”“与”连接的并列结构是指称性的 ,“并”“而”连接的并列结构是陈述性的。
吴云芳
一种基于情感计算与层次化多头注意力机制的负面新闻识别方法被引量:3
2020年
网络负面新闻识别在网络舆情监测中具有重要的研究意义.针对当前海量数据下负面新闻难以检测的问题,提出了一种基于情感计算与层次化多头注意力机制相结合的负面新闻识别方法.首先,从新闻文本中采用TF-IDF(Term Frequeney-Inverse Document Frquency)和语义相似度算法构建负面新闻情感词库;其次,采用情感倾向计算方法计算负面新闻情感词的情感倾向度;最后,将词语和词语的情感倾向度进行向量化表示,并采用层次化多头注意力机制进行正负面新闻的判定.情感计算和多头注意力机制的引入,对于捕获文本中的情感词语提供了很大帮助.最终本文基于真实的网络新闻文本数据与现有的多种算法进行对比,证明了该模型具有较好的识别效果,相比于Han模型和LSTM模型分别提高了0.67%和3.29%.
张仰森周炜翔张禹尧吴云芳
关键词:语义相似度情感计算情感倾向
基于TI-Rank的弹幕关键词提取方法被引量:3
2022年
为提供准确且更贴近日常用语的关键词,针对视频弹幕内容提出一种基于TI-RANK(TTF-ICDF-DWTextRank)的词频词义相结合的关键词提取模型。将标题内容进行分类得到标题的关键信息,将该信息用于词频提取构建TTF算法;进一步考虑词频与篇章数对提取效果的影响,通过分段函数构建ICDF算法;引入语义维度信息并利用中文拼音作为编辑距离的计算单元构建DWTextRank模型。实验结果表明,TI-RANK模型提取关键词的F1值达到0.8以上,相较传统TF-IDF和TextRank算法提高了约20%。为更合理评价关键词提取的准确率,按照关键词重要程度降序排列定义三级梯度评价标准,该标准能够更好体现出排序靠前关键词的正确性对准确率的影响。
何梓源张仰森吴云芳亓文法
基于词汇语义特征的中文语义角色标注研究被引量:7
2009年
语义角色除了受句法结构限制之外,同词汇的语义特征也有着紧密的内在联系。对于一些仅依靠句法分析不能很好解决的角色标注问题,如句法结构相同的两个成分所对应的角色分别为完全不同的施事、受事角色的情况,可以通过引入一些词汇语义特征来进行处理。该文基于北京大学的语义词典CSD,引入了配价数、主客体语义类等词汇语义特征来进行语义角色标注研究。10折交叉验证的结果显示,通过引用词汇语义特征,所有角色标注的总体评价F值比单纯使用句法特征上升了1.11%,而其中Arg0和Arg1角色标注的F值达到93.85%和90.60%,比仅使用句法特征进行角色标注分别提高了1.10%和1.26%。
邵艳秋穗志方吴云芳
关键词:语义分析语义角色标注句法分析语义词典
“是”字句主语和宾语的自动界定被引量:3
2002年
“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式 ,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现 ,总结、提取了“是”字句的自动标注规则 ,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明 ,对没有逗号的句子 ,标注正确率可达到 99%以上 ;对有逗号的句子 ,标注正确率为 89%。
吴云芳段慧明俞士汶
关键词:字句浅层分析主语宾语自然语言处理
共5页<12345>
聚类工具0