丁丰
- 作品数:6 被引量:37H指数:3
- 供职机构:北方交通大学计算机与信息技术学院信息科学研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于K-MEANS算法的语境相关矢量量化被引量:3
- 2000年
- 研究用于连续语音识别的语境相关矢量量化技术 .提出采用 k- means( k-均值 )算法逐一地调整决策树叶子所包含的各个语境 ,实现对音素模型的混合密度的优化 .实验结果表明 ,采用 k- means算法的语境相关矢量量化得到的平均分布密度比简单合并决策树叶子所得到的平均分布密度提高 4 %~ 1 0 %.
- 许晓斌丁丰林碧琴袁保宗
- 关键词:连续语音识别K-MEANS算法
- 基于编辑距离的结构模式方法被引量:7
- 2001年
- 以文字序列为研究对象 ,探索构建结构模式的方法 ,提出一种基于编辑距离的结构模式发现方法。该方法引入编辑距离对序列予以分类 ,认为在类中心附近的序列可以通过子结构规约到类中心 ,特征结构蕴藏在编辑序列中。然后对获得的上下文无关编辑操作引入伪上下文相关 ,再根据文法特征分裂和根据距离特征合并 ,在大量数据的基础上提取出结构模式。
- 丁丰袁保宗
- 关键词:模式识别
- 语言分析器中语言模糊的消除
- 本文简要地介绍了语言中广泛存在的模糊现象,并从多种语言模型的角度加以分析,特别讨论了语义模糊的处理方法,文末给出一个正在实现的自然语言理解系统的结构。
- 丁丰董娜林碧琴袁保宗
- 关键词:语义语法
- 文献传递
- 自然语言处理系统中自动分词的研究被引量:22
- 1999年
- 首先分析了自动分词方法的基本假设和实现途径以及现有方法的不足之处,然后介绍汉语自然语言整体处理信息框架和在自然语言整体处理框架中自动分词方法。
- 丁丰董娜林碧琴袁保宗
- 关键词:自然语言处理自动分词汉语处理
- 机器翻译中若干问题的探讨
- 本文描述了机器翻译的发展情况,对于三类机译系统进行了比较。将语料库技术应用到基于知识的机译系统中,可综合KBMT和SBMT两种系统的优点。本文着重讨论了语料库在机器翻译中的作用。最后对于语音翻译中的机器翻译模块进行了比较...
- 董娜林碧琴丁丰
- 关键词:机器翻译语料库
- 文献传递
- 一种基于最大熵原理的汉语实体提取方法被引量:5
- 2001年
- 采用最大熵原理实现汉语实体提取。在信息处理中信息提取具有越来越重要的作用 ,其中实体提取是一个重要研究方向。文中首先介绍了实体的基本概念、实体提取的一般方法以及性能评价指标 ,然后基于最大熵原理对汉语实体提取建立了随机过程模型。实验结果表明 ,最大熵方法提取汉语实体具有较好的性能。
- 丁丰袁保宗
- 关键词:最大熵原理汉语