杨晓东
- 作品数:2 被引量:8H指数:2
- 供职机构:江苏大学计算机科学与通信工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- CCRF与规则相结合的中文机构名识别被引量:6
- 2011年
- 针对复杂机构名难以识别的问题,提出一种CCRF与规则相结合的识别方法。以CCRF为基础,利用特征融合设计特征模板,融合相应有效规则库,为复杂机构名识别提供决策。对1998年1月的《人民日报》语料库进行开放测试,实验结果显示,机构名识别的准确率为89.92%,召回率为91.41%,F1值为90.66%。
- 杨晓东晏立尤慧丽
- 关键词:条件随机场规则库语料库
- 中文分词中组合型切分歧义的消解研究被引量:2
- 2011年
- 针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1998年1月《人民日报》语料中出现的组合型歧义字段进行训练和测试,实验显示消歧的平均准确率达89.33%。
- 尤慧丽晏立杨晓东
- 关键词:中文自动分词组合型歧义上下文信息