您的位置: 专家智库 > >

何彦青

作品数:49 被引量:108H指数:5
供职机构:中国科学技术信息研究所更多>>
发文基金:国家自然科学基金国际科技合作与交流专项项目中日国际合作项目更多>>
相关领域:自动化与计算机技术文化科学语言文字医药卫生更多>>

文献类型

  • 31篇期刊文章
  • 9篇专利
  • 7篇会议论文
  • 2篇学位论文

领域

  • 28篇自动化与计算...
  • 14篇文化科学
  • 7篇语言文字
  • 3篇医药卫生
  • 1篇经济管理
  • 1篇机械工程

主题

  • 26篇翻译
  • 23篇机器翻译
  • 8篇对齐
  • 8篇统计机器
  • 7篇统计机器翻译
  • 6篇抽取
  • 5篇短语
  • 4篇心音
  • 4篇语言
  • 4篇语言处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇网络
  • 3篇知识发现
  • 3篇神经网
  • 3篇神经网络
  • 3篇自适
  • 3篇自适应
  • 3篇文本
  • 3篇文档

机构

  • 38篇中国科学技术...
  • 7篇中国科学院自...
  • 4篇重庆大学
  • 3篇河北地质大学
  • 2篇北京联合大学
  • 2篇京都大学
  • 2篇科学技术振兴...
  • 1篇江西师范大学
  • 1篇中国人民大学
  • 1篇北京市科学技...
  • 1篇北京万方数据...
  • 1篇云南锡业集团...

作者

  • 49篇何彦青
  • 11篇石崇德
  • 8篇王惠临
  • 8篇李颖
  • 7篇张均胜
  • 6篇刘志辉
  • 6篇宗成庆
  • 6篇徐红姣
  • 6篇许德山
  • 5篇周玉
  • 5篇董诚
  • 4篇于薇
  • 4篇姚长青
  • 4篇丁亮
  • 3篇王莉军
  • 3篇郭兴明
  • 2篇高影繁
  • 2篇屈鹏
  • 2篇张娟
  • 2篇李传鹏

传媒

  • 8篇情报工程
  • 4篇情报科学
  • 4篇数据分析与知...
  • 3篇图书情报工作
  • 2篇情报学报
  • 2篇计算机工程与...
  • 2篇数字图书馆论...
  • 1篇仪器仪表学报
  • 1篇计算机研究与...
  • 1篇全球科技经济...
  • 1篇中文信息学报
  • 1篇中国科技资源...
  • 1篇科学技术创新
  • 1篇第二十六届全...
  • 1篇第九届全国机...

年份

  • 4篇2023
  • 5篇2022
  • 3篇2021
  • 1篇2020
  • 2篇2019
  • 1篇2018
  • 5篇2017
  • 4篇2016
  • 1篇2015
  • 8篇2014
  • 1篇2013
  • 1篇2012
  • 7篇2011
  • 1篇2010
  • 2篇2009
  • 1篇2008
  • 2篇2007
49 条 记 录,以下是 1-10
排序方式:
基于“松弛尺度”的短语翻译对抽取方法被引量:6
2007年
短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的Och提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与词对齐完全相容的短语对。本文给出一种基于"松弛尺度"的短语抽取方法,对不能完全相容的短语对,结合词性标注信息和词典信息来判断是否进行抽取,放松"完全相容"的限制,可以保证为更多的源短语找到目标短语。实验表明,该抽取方法的性能比Och的方法有明显的改善和提高。
何彦青周玉宗成庆王霞
关键词:人工智能机器翻译统计机器翻译
文本信息的翻译方法、装置及终端设备
本申请涉及自然语言处理领域,公开了一种文本信息的翻译方法、装置、终端设备及计算机可读存储介质,其中,文本信息的翻译方法包括:对待翻译文本信息进行解析,确定待翻译文本信息的主题文本与版式信息;基于主题文本与版式信息,确定待...
石崇德何彦青许德山
文献传递
2015全国机器翻译研讨会ISTIC评测报告被引量:3
2016年
中国科学技术信息研究所(ISTIC)机器翻译研发工程历史悠久,几经变迁。本文在回顾ISTIC机器翻译发展历史的基础上,介绍了最近参加第十一届全国机器翻译研讨会机器翻译评测(简称CWMT’2015)系统的具体表现。CWMT’2015评比中,ISTIC参加了维汉、藏汉、蒙汉三个机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现。
何彦青孟令恩丁亮石崇德李颖王莉军孙瑶
关键词:机器翻译
基于领域知识库的科技术语信息匹配模型研究被引量:5
2019年
【目的/意义】全面分析中外科技文献可以把握当前某个领域或主题的研究热点和研究趋势,为了应对机器翻译在分析海量外文科技文献时存在的科技术语翻译'领域不一致'问题,需要对科技术语信息匹配进行研究。【方法/过程】提出了一种基于领域知识库的科技术语信息匹配模型,通过利用领域知识库构建领域多义术语词典,为科技术语匹配更多翻译候选,并结合语言学特征、领域信息以及LSTM语言模型来挑选最合适译文。【结果/结论】用化工领域的数据进行测试,验证模型的有效性,为深入分析外文文献中的技术理论提供了可靠又便捷的方法。
孙玥莹何彦青吴广印
关键词:信息匹配机器翻译领域知识库
中日两国机器翻译研究进展及比较被引量:3
2011年
机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。
张均胜何彦青李颖王惠临
关键词:机器翻译
机器翻译系统融合方法及其应用探究
2011年
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。
何彦青石崇德于薇张均胜王惠临
关键词:机器翻译自然语言处理
基于语义角色标注的专利主题提取研究被引量:4
2014年
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。
孟令恩李颖何彦青屈鹏王惠临
关键词:语义角色标注主题抽取
基于机器翻译的专利术语翻译获取方法研究被引量:3
2014年
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。
何彦青刘建辉屈鹏李颖徐红姣
关键词:机器翻译
一种基于短文本相似度计算的主观题自动阅卷方法被引量:12
2014年
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
张均胜石崇德徐红姣高影繁何彦青
关键词:相似度主观题自动阅卷
专利检索系统中可视化查询的比较研究被引量:2
2015年
专利检索是一个非常复杂的过程,用户为了迅速高效地完成检索任务需要得到支持。专利检索过程的许多环节可以借助一些工具完成,其中就包括查询(式)构造工具。查询构造是一项高度依赖人工的任务,工具只能实现对可能有用数据进行预先计算,并针对用户进行可视化。信息检索系统中,查询过程和查询结果可视化的方式有很多。本研究提出了两种典型的原型系统设计,用于在专利检索过程中对不同的查询表达式进行比较。原型包含查询表达式构造因素和结果集大小因素,两种因素对于专利领域专家探究查询表达式的调整对检索效率的影响至关重要。本文开发的系统有助于在专利检索过程中对复杂查询表达式进行逐步优化,系统设计思想基于了领域专家型知识工程。
Julia J.Jürgens周雷李颖孟令恩石崇德何彦青
关键词:信息可视化信息检索
共5页<12345>
聚类工具0