您的位置: 专家智库 > >

上海市科委科研计划项目(055115001)

作品数:2 被引量:4H指数:1
相关作者:王麒江开忠顾君忠杨静陈海燕更多>>
相关机构:华东师范大学华东政法大学东南大学更多>>
发文基金:上海市科委科研计划项目国家社会科学基金上海市高校选拔培养优秀青年教师科研专项基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇领域本体
  • 2篇本体
  • 1篇奇异值
  • 1篇奇异值分解
  • 1篇文档
  • 1篇WEB
  • 1篇WEB文档
  • 1篇抽取
  • 1篇抽取算法

机构

  • 2篇华东师范大学
  • 1篇东南大学
  • 1篇华东政法大学

作者

  • 2篇王麒
  • 1篇成曦
  • 1篇杨静
  • 1篇顾君忠
  • 1篇江开忠
  • 1篇陈海燕

传媒

  • 1篇华东师范大学...
  • 1篇南昌大学学报...

年份

  • 1篇2009
  • 1篇2007
2 条 记 录,以下是 1-2
排序方式:
基于领域本体的WEB文档正文的抽取算法
2009年
通过分析当前Web文档抽取的主流方法以及存在的不足,提出了一种基于文本块的改进算法-BWTE(Block-base Web Text Extraction)。该算法首先采用过滤的方法去除广告、超链接等比较明显的噪音信息,然后通过自底向上的文本块分块算法抽取出Web文档的正文。
成曦陈海燕王麒
关键词:本体WEB文档
基于领域本体的文档自动摘要算法被引量:4
2007年
介绍了一种以潜语义分析模型为基础,辅之以领域本体的文档自动摘要算法.该方法在传统的基于统计的奇异值分解算法基础上,通过领域本体引入了文档主题识别以及概念相似度计算,更好地用形式化的方式描述了文档的主要内容;在文档主题和概念相似度的指导下,使用统计方法和启发式规则抽取文档中的关键句子作为摘要,并通过实验证明提高了摘要的质量.
王麒江开忠杨静顾君忠
关键词:本体奇异值分解
共1页<1>
聚类工具0