您的位置: 专家智库 > >

中国科学院知识创新工程重要方向项目(KGCX2-SW-511)

作品数:21 被引量:123H指数:6
相关作者:李淼张建杨攀乌达巴拉胡泽林更多>>
相关机构:中国科学院中国科学技术大学内蒙古大学更多>>
发文基金:中国科学院知识创新工程重要方向项目国家科技攻关计划国家自然科学基金更多>>
相关领域:自动化与计算机技术农业科学理学语言文字更多>>

文献类型

  • 21篇期刊文章
  • 5篇会议论文

领域

  • 23篇自动化与计算...
  • 2篇农业科学
  • 1篇语言文字
  • 1篇理学

主题

  • 11篇翻译
  • 10篇机器翻译
  • 6篇统计机器
  • 6篇统计机器翻译
  • 5篇翻译模型
  • 4篇搜索
  • 3篇农业
  • 3篇农业信息
  • 3篇解码
  • 2篇信息处理
  • 2篇语言模型
  • 2篇施肥
  • 2篇搜索算法
  • 2篇统计模型
  • 2篇爬虫
  • 2篇网络
  • 2篇网络爬虫
  • 2篇机器翻译系统
  • 2篇翻译系统
  • 2篇分词

机构

  • 26篇中国科学院
  • 10篇中国科学技术...
  • 1篇安徽省农业科...
  • 1篇内蒙古大学

作者

  • 23篇李淼
  • 13篇张建
  • 3篇杨攀
  • 3篇徐大庆
  • 3篇胡泽林
  • 3篇乌达巴拉
  • 3篇朱海
  • 2篇许桂艳
  • 2篇骆凯
  • 2篇罗毅
  • 2篇胡冠龙
  • 2篇张国兵
  • 2篇曾伟辉
  • 2篇强静
  • 2篇袁媛
  • 2篇朱鉴
  • 2篇张强
  • 1篇于静
  • 1篇耿英
  • 1篇雪艳

传媒

  • 5篇计算机系统应...
  • 4篇计算机工程与...
  • 3篇计算机应用
  • 2篇计算机应用与...
  • 2篇微电子学与计...
  • 2篇中文信息学报
  • 1篇农业工程学报
  • 1篇自动化与仪器...
  • 1篇农业网络信息

年份

  • 1篇2011
  • 1篇2010
  • 5篇2009
  • 11篇2008
  • 8篇2007
21 条 记 录,以下是 1-10
排序方式:
汉蒙翻译模型中的依存语法与形态信息应用研究被引量:6
2009年
该文提出将源语言句法信息和目标语言形态信息引入汉蒙机器翻译的模型构造中,以降低译文的词形错误率等问题。在源语言端,利用汉语依存句法分析器获取依存树,将依存句法信息以标注形式记在每个词上;在目标语言端,分析并获取蒙古语形态信息;利用LOP思想将源语言依存句法信息和目标语言形态信息引入翻译模型构造中。实验表明,其BLEU评分比传统的短语统计翻译模型有明显提高。该方法通过词、短语、句法三层面信息的结合,实现了汉蒙两种语言语法结构的平衡,特别适合于源语言形态信息贫乏而目标语言形态信息丰富的统计机器翻译系统。
骆凯李淼乌达巴拉杨攀朱海
关键词:人工智能机器翻译依存语法统计机器翻译
基于XML Schema的知识描述与模式验证被引量:2
2008年
设计一种基于XML的面向对象的知识表示方法,并完成其XML Schema设计。在XML Schema的约束规范下,开发相应的知识获取系统、验证查错系统和推理系统,从而构成一个完整专家系统开发平台。本文主要设计并实现其中的验证查错系统。通过JDOM对知识获取系统获得的XML知识库进行模式验证与错误处理,保证知识获取得到的知识的可用性。
许桂艳张建李淼耿英徐大庆
关键词:XMLJDOM
多民族语言农业信息处理平台的构建被引量:1
2008年
提出了构建多民族语言农业信息处理平台的方法,重点介绍怎样把机器翻译与农业信息处理平台结合,在原来的农业信息处理平台的基础上,进行了结构性改造,加入了翻译系统,研制了多语言农业信息处理平台.并以汉蒙双语农业技术咨询系统为例,介绍具体的实现与应用.得出了构建汉语/民族语言农业信息处理平台的一般方法.
强静张建李淼
关键词:农业信息推理机翻译模型机器翻译
多民族语言农业知识处理平台
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方案,最后以汉蒙双语农业技术咨询系统为例,介绍具体的实现与...
强静李淼高翊胡冠龙胡泽林
关键词:农业信息机器翻译
文献传递
一种有效解决汉语歧义切分的方法被引量:3
2007年
提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正确率为98.43%,以上数据表明该方法在解决汉语交集型歧义字段的问题时是行之有效的。
朱鉴张建李淼
关键词:有向图统计模型规则库歧义字段汉字切分
基于XML描述的知识框架及可视化设计实现被引量:2
2008年
结合知识表示的三种主流方法,实现了基于XML的知识框架表示,并结合该知识表示形式,设计实现了可视化组件JForest,实现知识模型调用、规则等的可视化建立,根据可视化的知识模型、规则设计器,完成知识模型及规则知识的建立。从而在提高智能农业信息系统开发平台可视化交互能力的基础上,大大方便应用系统开发。
李淼张建胡泽林张强许桂艳
关键词:XML知识框架
汉蒙统计机器翻译中的形态学方法研究被引量:12
2009年
该文将形态学方法引入到汉蒙统计机器翻译的研究中,尝试解决译文词形选择及语序混乱问题。首先介绍语料库的准备:对原始汉蒙平行语料库进行词法分析及标注,得到两组基础语料库,再由基础语料库生成两组用于形态学实验的派生语料库。其次阐述统计模型的训练,包括语言模型、翻译模型及生成模型。同时讨论了解码的扩展问题。最后重点分析两组形态学方法实验:词素模型实验和factored方法实验。结果表明,相对于基线(baseline)实验,引入形态学方法后两组实验的BLEU评分均有所提高,译文词形选择及语序混乱问题得到了一定程度的解决。
杨攀张建李淼乌达巴拉雪艳
关键词:计算机应用中文信息处理形态学统计机器翻译语料库统计模型
基于WSN的农业信息远程监控系统的设计与实现被引量:15
2008年
为提高农业自动化、信息化水平,本文通过对国内外农业信息监控系统研究现状的分析,应用无线传感网络和GSM网络,开发了反应农作物生长环境的农业信息远程监控系统,解决了农业信息远距离采集与实时传输问题。介绍了该系统的硬件组成和相应软件开发,探讨了无线传感网络在农业信息采集中的算法,并对该系统的传输特性与运行效果进行了试验验证。
骆凯李淼胡泽林
关键词:WSNGSM远程监控MSP430单片机
面向民族语言信息处理的汉语分词方法
本文提出了一种有效的汉语分词方法。该方法在计算N元概率时采用统计语言模型中常用的Katz 平滑算法,对计算N元概率时所用的最大似然法和加1平滑算法进行了改进,同时采用了将字符串映射到整数的方法设计了N元短语的词典结构,以...
朱鉴张建李淼强静杨攀
关键词:语言模型哈希表
文献传递
深层网络爬虫研究综述被引量:41
2008年
随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
曾伟辉李淼
关键词:深层网络网络爬虫信息检索URL动态网页
共3页<123>
聚类工具0