杜林
- 作品数:7 被引量:75H指数:4
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 开放系统中文API框架与多平台联接系统
- 孙玉芳吴健杜林叶以民李祥凯胡才勇李国华赵常春韦福耿增强宋立秋辛春生
- 该成果包括多字节字符与宽字符处理与自动转换系统,Internet/Intranet中文检索平台,LaTex中文图形界面排版系统,跨平台的中文输入方法与跨平台的中文输出技术,简繁汉语转换系统,通用软件测试系统及中文平台标准...
- 关键词:
- 关键词:信息检索简繁转换
- 跨语言信息检索研究进展被引量:19
- 2004年
- 随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。
- 张俊林曲为民杜林孙玉芳
- 关键词:跨语言信息检索中文信息处理
- 基于Web中文检索系统SEARCH2000的设计与实现被引量:13
- 2000年
- 本文详细介绍Search 2 0 0 0中文检索系统的设计思想及实现方法。与传统的全文检索系统相比 ,基于WEB的信息检索系统 ,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有名词和缩略词汇 ,这些特性成为影响查询精度的主要因素。针对Web的上述特性设计的Search2 0 0 0全文检索系统 ,使用智能化的页面相关分析、评分技术 ,以及高效数据存取、压缩算法和知识库的支持 ,使其具有使用方便、查询时间短、查询精度高等特点。
- 杜林张毅波孙玉芳
- 关键词:信息检索中文信息处理页面WEB
- 信息检索与文本挖掘被引量:5
- 1999年
- 从50年代以来一直使用的是传统的信息检索系统,随着互联网络和计算机的日益普及,基于网络环境下的信息检索系统以它的显著优势引起人们关注并成为新一代研究的课题。而文本挖掘的出现正是为本文信息的整理、分析、挖掘提供了更有效的手段。
- 吴健杜林
- 关键词:文本挖掘文档数据库信息检索系统查询结果召回率自动文摘
- 基于邻近关系的汉语及汉英跨语言文本检索研究
- 随着计算机以及互连网络技术的不断发展,计算机系统中存储的信息以几何级数方式增长,其中绝大部分信息以文本形式出现,信息的内容覆盖不同的学科领域,如何从性质各异的大量文档中查找到特定内容的相关信息成为信息检索领域研究工作的焦...
- 杜林
- 关键词:信息检索中文信息处理跨语言检索
- 平行语料库中双语术语词典的自动抽取被引量:38
- 2000年
- 本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集。然后对每个英文候选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。
- 孙乐金友兵杜林孙玉芳
- 关键词:术语抽取英汉平行语料库