您的位置: 专家智库 > >

陈臻刚

作品数:1 被引量:13H指数:1
供职机构:清华大学电子工程系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇置信度
  • 1篇字符
  • 1篇字符识别
  • 1篇文档
  • 1篇文档识别

机构

  • 1篇清华大学

作者

  • 1篇丁晓青
  • 1篇刘长松
  • 1篇彭良瑞
  • 1篇陈臻刚

传媒

  • 1篇计算机工程与...

年份

  • 1篇2002
1 条 记 录,以下是 1-1
排序方式:
文档识别中误切分字符拒识问题的研究被引量:13
2002年
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较低质量的印刷文本识别具有一定的普遍意义。
陈臻刚丁晓青刘长松彭良瑞
关键词:文档识别字符识别置信度
共1页<1>
聚类工具0