您的位置: 专家智库 > >

国家自然科学基金(60673043)

作品数:23 被引量:158H指数:8
相关作者:陈家骏戴新宇周俊生袁春风黄书剑更多>>
相关机构:南京大学南京师范大学江苏警官学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术环境科学与工程更多>>

文献类型

  • 23篇期刊文章
  • 7篇会议论文

领域

  • 26篇自动化与计算...
  • 4篇语言文字
  • 1篇环境科学与工...

主题

  • 5篇向量
  • 5篇句法分析
  • 4篇信息处理
  • 4篇支持向量
  • 4篇支持向量机
  • 4篇中文
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇文本分类
  • 4篇向量机
  • 4篇句法
  • 4篇计算机
  • 4篇计算机应用
  • 4篇汉语
  • 3篇人工智能
  • 3篇自然语言
  • 3篇相似度
  • 3篇机器翻译
  • 3篇共指消解
  • 3篇翻译

机构

  • 30篇南京大学
  • 8篇南京师范大学
  • 2篇江苏警官学院
  • 1篇安徽工业大学
  • 1篇徐州工程学院

作者

  • 19篇陈家骏
  • 11篇戴新宇
  • 10篇周俊生
  • 7篇袁春风
  • 4篇黄书剑
  • 4篇张亮
  • 2篇何亮
  • 2篇赵迎功
  • 2篇刘未鹏
  • 2篇奚宁
  • 2篇曲维光
  • 2篇尹存燕
  • 2篇武港山
  • 2篇胡仁龙
  • 2篇戴播
  • 2篇田宝明
  • 2篇濮小佳
  • 1篇李天侠
  • 1篇张建兵
  • 1篇李元龙

传媒

  • 8篇中文信息学报
  • 3篇计算机应用研...
  • 2篇计算机应用与...
  • 2篇广西师范大学...
  • 2篇计算机工程与...
  • 2篇计算机科学
  • 1篇电子学报
  • 1篇计算机工程
  • 1篇江南大学学报...
  • 1篇计算机技术与...

年份

  • 4篇2010
  • 8篇2009
  • 12篇2008
  • 6篇2007
23 条 记 录,以下是 1-10
排序方式:
基于中文宾州树库的浅层语义分析被引量:8
2008年
采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%。实验结果表明该方法对中文浅层语义分析工作是有效的。
连乐新胡仁龙杨翠丽袁春风
关键词:支持向量机语义角色标注
一种基于图划分的无监督汉语指代消解算法被引量:23
2007年
指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入一个有效的模块函数实现对图的自动划分,使得指代消解过程并不是孤立地对每一对名词短语分别进行共指决策,而是充分考虑了多个待消解项之间的相关性,并且避免了阈值选择问题。通过在ACE中文语料上的人称代词消解和名词短语消解实验结果表明,该算法是一种有效可行的无监督指代消解算法。
周俊生黄书剑陈家骏曲维光
关键词:人工智能自然语言处理聚类指代消解
中心词驱动的汉语统计句法分析模型的改进被引量:3
2008年
在对Dan Bikel基于Collins中心词驱动概率句法分析模型实现的句法分析器进行深入研究分析的基础上,对其进行了两个方面的改进。一是通过提供N-best词性候选序列,改进原模型在词性方面的处理,改善了句法分析的结果;二是在该模型中引进单独的基本名词短语识别,从而降低句法分析的复杂度,提高了效率,其中,针对中文的特点,通过对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响并探讨更适合中文句法分析的BaseNP定义。利用改进的句法分析模型进行中文句法分析实验,实验结果表明,改进模型可以缩短分析时间26%,提高F值4.4个百分点,交叉括号平均减少18%。
何亮戴新宇周俊生陈家骏
关键词:计算机应用中文信息处理基本名词短语汉语句法分析
决策式中文依存句法分析模型的改进
2009年
决策式依存分析方法是一种以统计学习分类算法为基础,在每一个分析步骤中挑选最有可能的分析动作,由最终的动作序列确定分析结果。该方法具有快速、高效,易于实现的特点。然而,各步分析动作相对独立,并且容易造成错误累积。针对这些问题,对原始算法进行了一定的改进,引进了局部搜索算法和两阶段分析。实验表明,基于局部搜索的两阶段决策式依存分析模型,在性能上好于原始决策式依存分析方法,同时保持了较低的时间复杂度。
马若策戴新宇陈家骏
关键词:依存句法分析局部搜索
文本情感分析中褒贬分类的分界点确定被引量:1
2009年
文中提出了两个确定褒贬分类的最佳分界点划分方法,使用了一个多层的神经网络进行文本褒贬度的计算并对其输出值的分布进行分析。通过实验验证了这两个方法在褒贬分类中的有效性,并和朴素贝叶斯方法进行比较。实验结果表明,通过该算法确定的褒贬分界点较传统的分界点0.5具有较高的准确率。
王海朋商琳戴新宇吉阳生
关键词:文本分类神经网络情感分析
基于语义树的中文词语相似度计算与分析
基于语义资源Hownet的词语相似度计算是近年来的研究热点,但大多数研究都是对中科院计算所刘群提出的计算方法的改进和完善。本文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类...
张亮尹存燕陈家骏
关键词:语义树词语相似度语义距离
文献传递
基于语义树的中文词语相似度计算与分析被引量:38
2010年
词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。
张亮尹存燕陈家骏
关键词:语义树词语相似度语义距离
并列复句的自动识别初探被引量:12
2008年
从《人民日报》语料库中抽取4万多个句子作为训练集和测试集,选取其主语、谓语等相关特征并根据《知网》将特征量化,然后使用支持向量机进行训练,获取判别并列复句的模型。在开放测试中获得了84%的准确率。
周文翠袁春风
关键词:并列复句知网支持向量机
一种命名实体翻译等价对的抽取方法被引量:10
2008年
有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两种语言文本进行命名实体标注。提出了一种只要求对语料库中源语言进行命名实体标注,目标语言不需标注,然后利用训练得到的HMM词对齐结果来抽取有关命名实体翻译等价对的方法。在实验中,把中文作为源语言,英文作为目标语言。实验结果表明用该方法,即使在对齐模型只是部分准确的情况下,也得到了较高正确率的命名实体翻译等价对。
陈怀兴尹存燕陈家骏
关键词:人工智能机器翻译HMM
Dirichlet过程及其在自然语言处理中的应用被引量:9
2009年
Dirichlet过程是一种典型的变参数贝叶斯模型,其优点是参数的个数和性质灵活可变,可通过模型和数据来自主地计算,近年来它已成为机器学习和自然语言处理研究领域中的一个研究热点。该文较为系统的介绍了Dirichlet过程的产生、发展,并重点介绍了其模型计算,同时结合自然语言处理中的具体应用问题进行了详细分析。最后讨论了Dirichlet过程未来的研究方向和发展趋势。
徐谦周俊生陈家骏
关键词:计算机应用中文信息处理
共3页<123>
聚类工具0