您的位置: 专家智库 > >

国家部委资助项目(2003WL01)

作品数:2 被引量:3H指数:1
相关作者:耿增民朱玉文刘万春贾云得更多>>
相关机构:北京理工大学更多>>
发文基金:国家部委资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇文摘
  • 1篇信息处理
  • 1篇语料
  • 1篇语料库
  • 1篇知识库
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇自动文本摘要
  • 1篇自动文摘
  • 1篇文本摘要
  • 1篇基于WEB
  • 1篇计算机
  • 1篇计算机应用

机构

  • 2篇北京理工大学

作者

  • 2篇刘万春
  • 2篇朱玉文
  • 2篇耿增民
  • 1篇贾云得

传媒

  • 1篇北京理工大学...
  • 1篇中文信息学报

年份

  • 2篇2006
2 条 记 录,以下是 1-2
排序方式:
基于Web的文摘技术研究被引量:1
2006年
W eb文档的迅猛增长使W eb文摘技术成了当今的一个研究热点。由于W eb文档的特殊性,使得W eb文摘不同于传统的文本自动文摘。本文分析了W eb文档的特点;给出了W eb文摘的定义;提出了基于句子抽取的W eb文摘生成算法。算法中将每个W eb句子权重分解为W eb特征词权重和W eb句子结构权重,并用机器学习的方法来计算二者所占的比重。W eb特征词权重根据文档分类树图进行权值调整,W eb句子结构权重充分考虑排版格式和超连接属性。通过对1000篇W eb文档的文摘实验,证明文中所提W eb文摘算法切实可行。
耿增民贾云得刘万春朱玉文
关键词:计算机应用中文信息处理
受限领域的自动文摘方法研究被引量:2
2006年
为解决受限领域统计型文摘对文档中心内容理解不足的缺陷,研究了结合领域知识生成单文档文摘的方法;论述了构建受限领域的语料库和知识库的方法;提出对粗文摘进行文摘句概化和在其中加入领域知识的文摘后处理方法.在所提出理论基础上开发了文摘系统软件.通过和MS Word 2003中的文摘工具进行实验对比,表明提出的方法切实可行,可以推广到其它领域.
耿增民刘万春朱玉文
关键词:自动文本摘要知识库语料库
共1页<1>
聚类工具0