梁桢
- 作品数:2 被引量:5H指数:1
- 供职机构:武汉工业学院数学与计算机学院更多>>
- 发文基金:湖北省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Hash结构词典的逆向回溯中文分词技术研究被引量:5
- 2010年
- 为了提高现有的中文分词效率,提出了基于Hash结构词典的逆向回溯中文分词方法。针对首字Hash结构词典的不足,设计了能够记录词长的Hash结构尾字词典,然后对逆向最大匹配分词算法进行了分析,为了解决其存在的中文分词歧义问题,设计出一种逆向回溯最大匹配算法,该改进算法采用的回溯机制能够有效消除分词中可能存在的一些歧义问题。实验结果表明,该方法实现了提高中文分词速度并减少交集型歧义字符串切分错误的设计目标。
- 梁桢李禹生
- 关键词:中文分词分词歧义
- 基于尾字词典的逆向回溯中文分词技术研究
- 中文分词是中文信息处理的第一步,其分词精确度及分词效率是中文信息处理性能高低的关键。在搜索引擎、文字校对、语音识别、机器翻译等中文信息处理技术应用领域,中文分词技术作为其基础,对推动中文信息处理技术的发展,满足各类应用的...
- 梁桢
- 关键词:中文分词分词算法消歧
- 文献传递