搜索到89篇“ 中文文本自动校对“的相关文章
- 中文文本自动校对被引量:29
- 2001年
- 本文详细介绍了中文文本自动校对的研究现状 ,包括文本中错误的分类 ,中文自动校对中常用的语言模型 ,以及一些有代表性的工作。作为参考 ,本文还介绍了英文拼写检查的方法 ,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对有参考价值的几种基于特征的方法。
- 张磊周明黄昌宁潘海华
- 关键词:中文文本自动校对拼写检查自然语言处理
- 中文文本自动校对综述被引量:1
- 2022年
- 文本校对在新闻发布、书刊出版、语音输入、汉字识别等领域有着极其重要的应用价值,是自然语言处理领域中的一个重要研究方向。该文对中文文本自动校对技术进行了系统性的梳理,将中文文本的错误类型分为拼写错误、语法错误和语义错误,并对这三类错误的校对方法进行了梳理,对中文文本自动校对的数据集和评价方法进行了总结,最后展望了中文文本自动校对技术的未来发展。
- 李云汉施运梅李宁田英爱
- 关键词:拼写错误语法错误数据集
- 基于深度学习的语义级中文文本自动校对研究
- 2022年
- 中文文本校对技术在字词级和语法级层面已取得了较好的效果,但在语义层面还没有比较成熟的方法。为实现语义级中文文本自动校对,将深度学习技术引入自动校对。首先,出于中文文本语义级自动校对的需要,在现有已公开的中文校对测试集的基础上,加入语义错误样本数据,并通过数据增强技术,扩大语义差错数据规模,以使训练集及测试集中语义错误占比达到50%以上。其次,针对典型的语义错误类型,构建其对应的语义知识集,包括成语知识集、古诗词知识集、历史人物主要事件朝代年表知识集、敬谦词知识集、地理知识集等。在建立语义知识集的基础上,基于BERT预训练模型对数据集进行训练。最后,经过预训练,在初步确定模型之后,结合关键参数,进行微调,确定最终的自动校对模型。
- 张芙蓉罗志娟
- 关键词:语义知识库中文文本
- 一种基于多通道融合与重排序的中文文本自动校对方法
- 本发明公开了一种基于多通道融合与重排序的中文文本自动校对方法。该方法中的神经机器翻译模型选择卷积编解码网络,通过三个预测通道结合字级别和子词级别的校对模型,其中各通道均启用集成解码机制并输出N个最佳候选,然后应用重排序组...
- 李天瑞杨宗霖刘胜久殷成凤贾真
- 文献传递
- 中文文本自动校对技术研究综述
- 2022年
- 文本自动校对属于自然语言处理技术研究内容之一,中文文本自动校对技术是中文信息处理技术的关键环节,可实现中文文本的自动化校对。首先阐述了中文文本校对技术的研究现状,中文文本校对方法的研究主要包括基于各种语言模型的自动校对探索、面向专业领域的中文文本校对研究、与语料库相关的校对研究、语义级的中文校对方法研究、基于深度学习的自动校对方法等;其次,探讨了中文文本自动校对实验数据集与校对算法性能评价指标;最后,针对产业界中文文本自动校对技术的产品研发及推广、结合出版界对中文文本自动校对手段的使用诉求,给出了中文文本自动校对的未来发展方向:即语义级中文文本校对的研究,大规模语料库、知识库、测评数据集的构建,将新方法应用于中文文本自动校对的研究。
- 张芙蓉
- 关键词:中文文本
- 中文文本自动校对技术研究
- 随着信息化技术的不断发展,中文文本数量呈爆炸式增长的趋势。与文本数量一同增长的是文本当中的错字数量。文本中的错别字可能会带来不良的社会影响与经济影响,这体现在众多行业当中,例如教育行业、司法行业、新闻行业等等。在计算机技...
- 王重元
- 中文文本自动校对方法研究综述被引量:1
- 2022年
- 文本自动校对作为自然语言处理领域的热点方向,受到人们的广泛研究。针对不同错误类型的中文文本,可将其分为拼写纠错、语法纠错和语义纠错3类。首先简要介绍了中文文本校对的相关信息,然后分别对基于传统与深度学习的中文文本校对方法进行分析、总结,以指出该领域所存在的问题,并提出改进方案。通过对现阶段中文文本自动校对方法的研究与分析,为从事该领域的学者提供一定的参考与借鉴。
- 白雪丽李建义王洪俊贾盼盼王迦南
- 关键词:自然语言处理语言模型
- 一种基于多粒度融合与Bert筛选的中文文本自动校对方法
- 本发明涉及一种基于多粒度融合与Bert筛选的中文文本自动校对方法,属于自然语言处理技术领域;本发明通过结合字粒度与词粒度级别的校对模型,以期能够利用不同粒度级别的信息。字粒度模型采用集成规则生成候选集与Bert筛选的方法...
- 张翔宇张旭王鹏刘春阳解峥商建云张华平蔡佳豪杜伦
- 基于上下文的中文文本自动校对方法
- 随着现代化信息传播及处理方式的演变,文本类信息数量剧增。依靠人力校对文本内容这一环节亟需计算机的辅助。文本校对任务的方向常常以字词错误为基础,鉴于中文文本字词错误随着文本类信息同时增长,文本语义类错误难以使用传统方法查找...
- 王匆匆
- 关键词:中文文本自动校对N元文法端到端TRANSFORMER
- 文献传递
- 基于Transformer模型的中文文本自动校对研究被引量:4
- 2020年
- 提出将Transformer模型应用于中文文本自动校对领域。Transformer模型与传统的基于概率、统计、规则或引入BiLSTM的Seq2Seq模型不同,该深度学习模型通过对Seq2Seq模型进行整体结构改进,从而实现中文文本自动校对。通过使用公开数据集对不同模型进行对比实验,采用准确率、召回率与F1值作为评价指标,实验结果表明,Transformer模型相比较于其他模型,在中文文本自动校对的性能上有了大幅提升。
- 龚永罡裴晨晨廉小亲王嘉欣
相关作者
- 骆卫华

- 作品数:23被引量:193H指数:6
- 供职机构:中国科学院计算技术研究所
- 研究主题:机器翻译 中文文本自动校对 系统聚类 计算机辅助翻译 向量空间模型
- 罗振声

- 作品数:22被引量:282H指数:11
- 供职机构:清华大学
- 研究主题:向量空间模型 中文信息处理 汉语句型 中文文本自动校对 语义
- 汪维家

- 作品数:11被引量:171H指数:4
- 供职机构:北京交通大学理学院
- 研究主题:公钥基础设施 中文文本 中文文本自动校对 会话密钥 密码学
- 龚小谨

- 作品数:80被引量:123H指数:6
- 供职机构:浙江大学
- 研究主题:图像 深度图像 显著性检测 测图 标签
- 陆汝占

- 作品数:103被引量:493H指数:10
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系
- 研究主题:自然语言处理 信息处理 自然语言理解 汉语 句法分析