您的位置: 专家智库 > >

曹淑英

作品数:3 被引量:100H指数:2
供职机构:中国石油大学(华东)计算机与通信工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇中文
  • 2篇自动文摘
  • 2篇文摘
  • 1篇信息处理
  • 1篇信息服务
  • 1篇语言处理
  • 1篇知网
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇中文自动文摘
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇组块
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇互联
  • 1篇互联网
  • 1篇个性化
  • 1篇个性化信息

机构

  • 3篇中国石油大学...
  • 1篇北京理工大学

作者

  • 3篇曹淑英
  • 2篇索红光
  • 1篇刘玉树

传媒

  • 1篇计算机系统应...
  • 1篇中文信息学报

年份

  • 2篇2007
  • 1篇2006
3 条 记 录,以下是 1-3
排序方式:
一种基于词汇链的关键词抽取方法被引量:98
2006年
关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用。词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构。本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用《知网》为知识库构建词汇链的算法。通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择。该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能。实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%。
索红光刘玉树曹淑英
关键词:中文信息处理关键词标引关键词抽取词汇链知网
基于组块的中文自动文摘系统研究被引量:2
2007年
传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高。为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法。系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块。由句子中出现的组块作为衡量句子重要性的标准选出文摘句。文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容。
索红光曹淑英
关键词:自然语言处理自动文摘向量空间模型
个性化自动文摘的研究与实现
随着Internet的普及与发展,网络已成为一个巨大的信息源。大量的数字信息在带给人们丰富便利的信息资源的同时,也给有效信息的快速获取带来了困难。自动文摘技术是自然语言处理领域的一个课题,它利用计算机自动地对文章进行处理...
曹淑英
关键词:个性化信息服务自动文摘互联网
文献传递
共1页<1>
聚类工具0