李成城
- 作品数:14 被引量:15H指数:3
- 供职机构:内蒙古师范大学计算机与信息工程学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于OCR的纵向文字校对的研究与实现被引量:1
- 2006年
- 提出一种基于OCR识别的文字纵向校对的实现方法,在文字信息处理、图像显示和校对过程中提出了自己的算法和策略,对数组结构及其读写方法进行了较细致的分析。以汉字的纵向校对为例,实验表明该方法具有很快的计算速度,对一个有经验的校对人员而言,通过纵校和横校的结合可以使差错率控制在万分之三以内。
- 李成城白涛赵述芳钟义信
- 关键词:OCR文字处理
- 基于统计的中文四字姓名识别方法
- 2012年
- 采用统计方法来识别中文四字姓名。该方法将中文四字姓名的识别过程分为姓名候选和姓名求精两个阶段。采用二元隐马尔科夫模型从已经切分好的文本中候选姓名。利用边界规则对候选姓名进行求精。实验结果表明,该方法的召回率为82.9%,准确率为87.3%。
- 刘兴义李成城
- 关键词:人工智能自然语言处理隐马尔科夫模型
- 基于LDA与TextRank结合的多文档自动摘要研究被引量:3
- 2018年
- 大数据时代信息量急剧增长,伴随而来的是大量冗余信息的出现。为快速、准确、全面搜索到所需信息,提出一种LDA主题模型与TextRank算法相结合的算法。首先通过对预处理后的文档建立主题模型,得到句子的概率模型即文档中句子的重要性,然后考虑运算节点权重时的主题概率,得到新的迭代公式,通过对同一主题下的多篇新闻报道进行处理得到这些文档的文摘。实验结果表明,该方法生成的文摘较单一算法效果显著。
- 张波飞李成城
- 关键词:冗余文摘
- 基于支持向量机和约束条件的新词识别研究被引量:2
- 2014年
- 中文分词的关键技术之一在于如何正确切分新词,文中提出了一种新的识别新词的方法。借助支持向量机良好的分类性,首先对借助分词词典进行分词和词性标注过的训练语料中抽取正负样本,然后结合从训练语料中计算出的各种词本身特征进行向量化,通过支持向量机的训练得到新词分类支持向量。对含有模拟新词的测试语料进行分词和词性标注,结合提出的相关约束条件和松弛变量选取候选新词,通过与词本身特征结合进行向量化后作为输入与通过训练得到的支持向量机分类器进行计算,得到的相关结果与阈值进行比较,当结果小于阈值时判定为一个新词,而计算结果大于阈值的词为非新词。通过实验结果比较选取最合适的支持向量机核函数。
- 徐远方李成城
- 关键词:新词识别支持向量机核函数
- 基于SVM和词间特征的新词识别研究被引量:4
- 2012年
- 中文分词的难点在于处理歧义和识别未登录词,因此对新词的正确识别具有重要作用。文中结合提出的新词词间模式特征以及各种词内部模式特征,对从训练语料中抽取正负样本进行向量化,通过支持向量机的训练得到新词分类支持向量。对测试语料结合绝对折扣法进行新词候选的提取与筛选,并与训练语料中提取的词间模式特征以及各种词内部模式特征进行向量化,得到新词候选向量,最后将训练语料中得到的新词分类支持向量以及对测试语料中得到的新词候选向量结合进行SVM测试,得到最终的新词识别结果。
- 徐远方李成城
- 关键词:自然语言处理支持向量机新词识别
- 图书馆电子文献检索
- 2008年
- 在图书馆电子文献检索中,搜索引擎可以为用户进行网络导航,帮助用户在大量的网络信息中快速查找所需的站点或网页,筛选出符合用户需求的有用信息。搜索引擎是专门为用户提供信息发布和信息查询服务的一种软件系统,其实它也就是一种网络数据库系统。
- 武红李成城
- 关键词:搜索引擎中文分词
- 自然语言理解在蒙古文自动文摘中的研究
- Internet网络的迅速普及成为信息时代的重要标志,面对潮水般涌来的电子文献,以全文阅读的方式来搜寻所需资料,显然是低效率的。更为关键的是,人的阅读速度远远跟不上文献的增长速度。因此,通过阅读文摘来获取有用的资料是一种...
- 李成城
- 关键词:修辞结构理论自然语言理解自动文摘蒙古文信息处理
- 文献传递
- 基于修辞结构理论的文本结构自动分析
- 2013年
- 自然语言处理的最终目的是实现机器对自然语言的理解,要实现这一目的,必须对文本在结构上进行分析,而连词在语篇结构中起着至关重要的作用。因此,本文基于本体论和修辞结构理论设计了一种连词词典,并基于该词典设计了修辞结构分析算法,用于对中文语篇进行修辞结构的分析。
- 王鹏李成城
- 关键词:修辞结构理论本体
- 基于WIKI环境的大学计算机基础教学的三级管理模式探究
- 2013年
- 随着Web 2.0技术的发展,WIKI作为Web 2.0的一种典型应用,特别是WIKI可编辑修改的特点,使得人们越来越重视WIKI在教学应用中的研究。本文以大学计算机基础教学为例,构建了基于WIKI环境下的教学的三级管理模式,极大地提高了学生参与学习的积极性和教学的交互性,从而达到了良好的教学效果。
- 李成城赵希武
- 关键词:WIKI教学
- 天气预报口语对话系统的设计与实现
- 随着网络信息的日益增加和广泛传播,口语对话系统已经为越来越多的研究者所关注。本文主要介绍了一个天气预报口语对话系统的设计与实现,该系统可以实现对国内外150个城市的天气情况的查询。在实验室环境下,该系统表现了良好的性能。
- 刘建毅马莉李成城
- 关键词:网络服务人机对话自然语言语音识别
- 文献传递