李清隐
- 作品数:4 被引量:29H指数:3
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于统计的汉英法律文献亚句子级对齐被引量:10
- 2003年
- 基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·
- 吕学强李清隐任飞亮姚天顺
- 关键词:双语语料库标准正态分布
- 汉英法律文献的子条级自动索引和对齐被引量:3
- 2002年
- 本文提出了基于结构标识的法律文献层次结构模型 ,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性。根据该模型实现了汉英法律文献的子条级自动索引和对齐 ,系统具有纠错和容错能力。实验结果表明每篇文献的平均索引时间为 3 31ms ,对齐准确率为 98 6 %。与基于词汇的方法结合后 ,对齐准确率为 99 3%。
- 吕学强李清隐陈文亮姚天顺
- 关键词:法律文献文本索引文本对齐汉语
- 基于统计的汉英句子对齐研究
- 翻译比较规范的汉英语料适合用统计方法实现句子对齐.但评价函数中的参数计算不能采用处理印欧语种的方法,而要针对汉英语种的特点进行调整在已有两种评价函数的基础上,文中又提出五种评价函数,并进行了对比研究.
- 吕学强李清隐任飞亮姚天顺
- 关键词:双语语料句子对齐评价函数
- 文献传递
- 基于统计的汉英句子对齐研究被引量:18
- 2004年
- 翻译比较规范的汉英语料适合用统计方法实现句子对齐 .但评价函数中的参数计算不能采用处理印欧语种的方法 ,而要针对汉英语种的特点进行调整 .在已有两种评价函数的基础上又提出五种评价函数 ,并进行了对比研究 .
- 吕学强李清隐黄志丹沈嫣娜姚天顺
- 关键词:双语语料句子对齐评价函数