曹淑英
- 作品数:3 被引量:100H指数:2
- 供职机构:中国石油大学(华东)计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于词汇链的关键词抽取方法被引量:98
- 2006年
- 关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用。词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构。本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用《知网》为知识库构建词汇链的算法。通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择。该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能。实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%。
- 索红光刘玉树曹淑英
- 关键词:中文信息处理关键词标引关键词抽取词汇链知网
- 基于组块的中文自动文摘系统研究被引量:2
- 2007年
- 传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高。为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法。系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块。由句子中出现的组块作为衡量句子重要性的标准选出文摘句。文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容。
- 索红光曹淑英
- 关键词:自然语言处理自动文摘向量空间模型
- 个性化自动文摘的研究与实现
- 随着Internet的普及与发展,网络已成为一个巨大的信息源。大量的数字信息在带给人们丰富便利的信息资源的同时,也给有效信息的快速获取带来了困难。自动文摘技术是自然语言处理领域的一个课题,它利用计算机自动地对文章进行处理...
- 曹淑英
- 关键词:个性化信息服务自动文摘互联网
- 文献传递