您的位置: 专家智库 > >

郑敏

作品数:2 被引量:4H指数:1
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 1篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇韵律短语
  • 1篇多音字
  • 1篇信息处理
  • 1篇韵律词
  • 1篇韵律结构
  • 1篇特征提取
  • 1篇统计模型
  • 1篇普通话
  • 1篇注音
  • 1篇注音方法
  • 1篇字音转换
  • 1篇文字信息
  • 1篇文字信息处理
  • 1篇律词

机构

  • 2篇清华大学

作者

  • 2篇郑敏
  • 2篇蔡莲红

传媒

  • 1篇清华大学学报...

年份

  • 1篇2006
  • 1篇2004
2 条 记 录,以下是 1-2
排序方式:
一种新的基于规则的多音字自动注音方法
本文统计了大量正确标音的语料,结果表明220个多音字的出现频度占总频度的99%以上。本文针对这220个多音字,提出了一种新的基于规则的多音字自动注音的方法。该方法首先对语句中的多音字进行预分类,然后基于8项特征提取规则,...
郑敏蔡莲红
关键词:字音转换多音字韵律短语特征提取
文献传递
基于概率频度的普通话韵律结构预测统计模型被引量:4
2006年
为进一步提高文语转换系统中韵律结构预测的准确度,提出了一个基于概率频度的统计模型的方法,预测韵律词和韵律短语边界两级韵律结构。该方法提取与韵律词和韵律短语边界有关的语言学特征(词性、语法词、长度和位置等),并进行样本训练计算各个特征的概率频度值,最终分别建立韵律词和韵律短语的统计模型。实验结果表明:统计模型的方法对于韵律词和韵律短语边界预测的正确率分别可达90.6%和84.6%,并与决策树算法和T ransform ation-based learn ing(TBL)转换规则学习算法比较,提高10%以上的正确率。
郑敏蔡莲红
关键词:文字信息处理韵律词韵律短语统计模型
共1页<1>
聚类工具0