您的位置: 专家智库 > >

教育部人文社会科学研究基金(07JA870005)

作品数:4 被引量:25H指数:4
相关作者:张云秋冷伏海郭柯磊余睿蜚更多>>
相关机构:吉林大学中国科学院文献情报中心北京大学更多>>
发文基金:教育部人文社会科学研究基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇文化科学
  • 1篇自动化与计算...

主题

  • 4篇文献知识
  • 4篇非相关文献
  • 4篇非相关文献知...
  • 2篇语义
  • 2篇词频
  • 1篇信息抽取
  • 1篇义类
  • 1篇语义类型
  • 1篇知识发现
  • 1篇排序
  • 1篇副主题
  • 1篇副主题词
  • 1篇MESH
  • 1篇标题
  • 1篇抽取
  • 1篇词频统计

机构

  • 4篇吉林大学
  • 2篇中国科学院文...
  • 1篇北京大学

作者

  • 4篇张云秋
  • 2篇冷伏海
  • 1篇余睿蜚
  • 1篇郭柯磊

传媒

  • 2篇情报学报
  • 1篇情报科学
  • 1篇图书情报工作

年份

  • 3篇2009
  • 1篇2008
4 条 记 录,以下是 1-4
排序方式:
基于双向词频统计的非相关文献知识发现排序方法研究被引量:13
2009年
在对现有非相关文献知识发现的中间集排序方法进行分析的基础上,以共现理论为基础,以主题关联度为着眼点,对基于词频统计的B排序方法进行了拓展,引入共现低频的思想,提出基于双向词频统计的中间集排序方法,并对其意义及可操作方法进行了初步试验。
张云秋郭柯磊
关键词:非相关文献知识发现词频
非相关文献知识发现初始集过滤方法的试验研究被引量:7
2009年
在对现有非相关文献知识发现的初始集过滤方法进行分析的基础上,提出基于副主题词和基于共现语义群两种过滤方法。以Swanon的早期发现之一为对照进行试验,考察经两种方法过滤后中间集B的范围以及目标关联词和目标关联对的出现情况,以此作为评价其对B影响的依据。结果表明两种过滤方法均可提高B的质量,从而提高发现效率。
张云秋冷伏海
关键词:非相关文献知识发现副主题词
对非相关文献知识发现中初始文本集结构的试验研究被引量:5
2009年
本文尝试分析在非相关文献知识发现中,标题对文摘的替代效果,标题和MeSH提供的信息内容与文摘提供的信息内容的近似度,标题与文摘提供的信息内容与MeSH字段提供的信息内容的近似度。通过统计各字段所有词的词频.从高频词的数量、分布及变化趋势等定量的方面,以及具体高频词和语义类型等定性方面对各字段进行对比分析。结果表明标题对文摘有很好的替代效果,标题与MeSH结合对文摘的替代效果较标题与文摘结合对MeSH的替代效果要好。
张云秋余睿蜚
关键词:非相关文献标题MESH词频语义类型
非相关文献知识发现的关键技术研究被引量:12
2008年
本文在对非相关文献知识发现中的关键技术进行界定的基础上,对11个国外主要的非相关文献知识发现研究中所涉及的关键技术,即初始文本集的构建、信息抽取及中间关联词的确定与排序等进行了比较研究,认为B集合质量低是非相关文献知识发现目前存在的主要问题。针对该问题,作者提出以提高B集合的质量为主要目标,从B集合形成的前过程,即初始文本集的质量以及B集合本身的质量,即B词的排序两个方面的改进策略。前者包括初始文本集的合理结构及综合过滤机制,后者包括双向词频法、基于MeSH加权和基于文献内聚力加权。并对部分改进策略进行了试验。
张云秋冷伏海
关键词:非相关文献知识发现信息抽取
共1页<1>
聚类工具0