您的位置: 专家智库 > >

姜文斌

作品数:42 被引量:100H指数:7
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术语言文字电子电信更多>>

文献类型

  • 17篇期刊文章
  • 11篇会议论文
  • 11篇专利
  • 3篇科技成果

领域

  • 21篇自动化与计算...
  • 8篇语言文字
  • 1篇电子电信

主题

  • 13篇翻译
  • 11篇机器翻译
  • 11篇词法分析
  • 8篇语言
  • 7篇切分
  • 7篇词语
  • 7篇词语切分
  • 6篇统计机器
  • 6篇统计机器翻译
  • 6篇词性
  • 6篇词性标注
  • 5篇依存
  • 5篇有向图
  • 5篇语料库
  • 5篇源语
  • 5篇源语言
  • 5篇蒙古语
  • 5篇词干
  • 5篇词干提取
  • 4篇有向图模型

机构

  • 41篇中国科学院
  • 6篇内蒙古大学
  • 4篇青海师范大学
  • 3篇新疆大学
  • 3篇河南师范大学
  • 3篇中国科学院大...
  • 2篇北京交通大学
  • 2篇陕西师范大学
  • 1篇华南师范大学
  • 1篇四川大学
  • 1篇苏州大学
  • 1篇新疆财经大学
  • 1篇中国科学院研...
  • 1篇中国科学院新...

作者

  • 42篇姜文斌
  • 31篇刘群
  • 19篇吕雅娟
  • 6篇王志洋
  • 6篇刘凯
  • 5篇吴金星
  • 5篇孟凡东
  • 3篇钱跃良
  • 3篇长青
  • 3篇熊德意
  • 3篇乌日力嘎
  • 2篇王向东
  • 2篇徐金安
  • 2篇骆卫华
  • 2篇那顺乌日图
  • 2篇刘宏
  • 2篇麦热哈巴艾力
  • 2篇刘洋
  • 2篇涂兆鹏
  • 2篇赵海兴

传媒

  • 11篇中文信息学报
  • 2篇第五届全国机...
  • 1篇北京大学学报...
  • 1篇计算机工程
  • 1篇软件学报
  • 1篇计算机系统应...
  • 1篇计算机工程与...
  • 1篇北京邮电大学...
  • 1篇第三届全国少...
  • 1篇第十三届中国...
  • 1篇第八届全国机...

年份

  • 2篇2018
  • 2篇2017
  • 2篇2016
  • 2篇2015
  • 10篇2014
  • 1篇2013
  • 6篇2012
  • 10篇2011
  • 2篇2010
  • 4篇2009
  • 1篇2008
42 条 记 录,以下是 1-10
排序方式:
维吾尔语和韩语形态分析之模型构建被引量:2
2018年
为维吾尔语和韩语形态分析建立了一种图状结构的判别式模型,该模型将语句的形态分析建模为形态成分的图状结构,通过灵活丰富的特征设计描述了词语内部形态成分之间以及分属相邻词语的形态成分之间的关联约束.相比传统的线性模型,图状模型更好地考虑了各形态成分之间的语言学关联,从而取得更高的整句分析性能.在维吾尔语和韩语上的实验结果表明,图状模型相比线性模型的性能有一定提升,形态分析词级准确率分别提升了4.4%和2.8%.
徐春蒋同海蒋同海姜文斌
关键词:形态分析
基于上下文的拉丁维文拼写校对的研究
2011年
根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融合的方法,实现了基于上下文的拉丁维文的自动拼写校对系统,从而大大提高了拉丁维文的校对准确率。在新疆大学提供的维文语料库的测试中,拉丁维文的校对准确率达到了90.1%。
何晋一陈红英姜文斌张海波刘群
关键词:有向图模型词语切分语言模型上下文
蒙古语词法分析的有向图模型被引量:3
2011年
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词缀及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻画了词干到词干转移概率、词缀到词缀转移概率、词干到词缀生成概率、相应的标注之间的三种转移或生成概率,以及词干或词缀到相应标注相互生成概率。以内蒙古大学开发的20万词规模的三级标注人工语料库为训练数据,该模型取得了词级切分正确率95.1%,词级联合切分与标注正确率93%的成绩。
姜文斌吴金星长青那顺乌日图刘群赵理莉
关键词:词法分析词语切分词性标注词干提取有向图
一种用于盲人读取汉字的方法及系统
本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标...
王向东杨阳钱跃良刘宏张金超姜文斌
文献传递
翻译一致性的方法和装置及统计机器翻译方法和系统
本发明提供一种评价术语领域翻译一致性的方法,该方法以双语平行语料库的文档‑主题分布信息作为术语翻译的领域信息,构建双语术语库,并计算每个源语言术语的翻译一致性强度来客观地评价在领域内术语翻译的一致性。该方法充分利用领域信...
孟凡东熊德意姜文斌刘群
文献传递
基于词对依存分类的藏语树库半自动构建研究被引量:7
2013年
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
华却才让姜文斌赵海兴刘群
基于线性模型的汉语词法分析方法
本发明提供一种基于线性模型的汉语词法分析方法,包括如下步骤:1)输入汉语语句,设定分析窗口长度;2)对语句进行逐字分析,对语句中的每一个字,将该字时间窗口内的字或字元组输入感知机分类器,得出当前字标注为某一分词标注和词性...
姜文斌黄亮刘群吕雅娟
文献传递
蒙古语词法分析的生成式统计建模
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词级及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻面了词干到...
姜文斌吴金星长青赵理莉刘群那顺乌日图
关键词:蒙古语词法分析词语切分词性标注词干提取统计建模
文献传递
关注语言本身难题,推进民族语言翻译
姜文斌吕雅娟
异种语料融合方法:基于统计的中文词法分析应用被引量:5
2012年
基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能。高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未能充分利用,分词精度下降等问题。针对该问题,该文提出了简单有效的异种语料的自动融合方法,并通过实验验证了提案方法的有效性、较强的实用性以及对多种语料融合的可扩展性。
孟凡东徐金安姜文斌刘群
关键词:词法分析
共5页<12345>
聚类工具0