张金柱
- 作品数:4 被引量:9H指数:2
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于字位的中文分词方法研究与实现
- 自动分词是中文信息处理领域的一项基本技术,也是智能化中文信息处理的关键,它在机器翻译、信息检索、文本分类等中文信息处理的各项任务中都发挥着基础性的重要作用。
本文在分析中文分词技术现状和问题的基础上,采用和试验...
- 张金柱
- 关键词:中文分词自动分词中文信息处理最大熵条件随机场
- 文献传递
- 基于字位信息的中文分词方法研究被引量:4
- 2008年
- 分析中文自动分词的现状,介绍和描述几种不同的分词思想和方法,提出一种基于字位的分词方法。此分词方法以字为最小单位,根据字的概率分布得到组合成词的概率分布,因此在未登录词识别方面比其它方法有更优秀的表现。使用最大熵的机器学习方法来进行实现并通过两个实验得出实验结果的比较分析。
- 张金柱张东王惠临
- 关键词:中文分词最大熵未登录词识别
- 基于科技文献资源的跨语言信息检索系统研究被引量:1
- 2009年
- 本文分析了跨语言信息检索的现状,介绍和描述跨语言信息检索的主要问题,并针对万方数据和NSTL的现有资源,构建出基于科技文献的跨语言信息检索原型系统,此原型系统通过字典查询得到检索词翻译,应用Google在线翻译进行标题、摘要翻译,并预留中国科学院自动化所提供的翻译引擎扩展。跨语言信息检索强调检索结果翻译的可读性,帮助用户理解基本大意,不刻意追求准确性,力求在应用过程中促进机器翻译技术的进步和发展,辅助科研。
- 张金柱
- 关键词:跨语言信息检索信息检索系统科技文献资源
- 基于翻译检索一体化的跨语言信息检索研究被引量:3
- 2009年
- 从检索方法、结果展现和评估方法三方面分析跨语言信息检索的现状,引出翻译检索一体化的跨语言信息检索方法,把翻译、检索结合在同一检索模型中。一体化将翻译和检索中的不确定性组合在一起,从而做出更全局的优化,减少跨语言信息检索与单语检索之间的差距,从而充分利用单语检索中的有用方法;并针对万方数据现有资源,构建出面向科技文献的跨语言信息检索系统框架。
- 张金柱蒋勇青
- 关键词:跨语言信息检索一体化查询翻译科技文献资源