教育部人文社会科学研究基金(07JA870005)
- 作品数:4 被引量:25H指数:4
- 相关作者:张云秋冷伏海郭柯磊余睿蜚更多>>
- 相关机构:吉林大学中国科学院文献情报中心北京大学更多>>
- 发文基金:教育部人文社会科学研究基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于双向词频统计的非相关文献知识发现排序方法研究被引量:13
- 2009年
- 在对现有非相关文献知识发现的中间集排序方法进行分析的基础上,以共现理论为基础,以主题关联度为着眼点,对基于词频统计的B排序方法进行了拓展,引入共现低频的思想,提出基于双向词频统计的中间集排序方法,并对其意义及可操作方法进行了初步试验。
- 张云秋郭柯磊
- 关键词:非相关文献知识发现词频
- 非相关文献知识发现初始集过滤方法的试验研究被引量:7
- 2009年
- 在对现有非相关文献知识发现的初始集过滤方法进行分析的基础上,提出基于副主题词和基于共现语义群两种过滤方法。以Swanon的早期发现之一为对照进行试验,考察经两种方法过滤后中间集B的范围以及目标关联词和目标关联对的出现情况,以此作为评价其对B影响的依据。结果表明两种过滤方法均可提高B的质量,从而提高发现效率。
- 张云秋冷伏海
- 关键词:非相关文献知识发现副主题词
- 对非相关文献知识发现中初始文本集结构的试验研究被引量:5
- 2009年
- 本文尝试分析在非相关文献知识发现中,标题对文摘的替代效果,标题和MeSH提供的信息内容与文摘提供的信息内容的近似度,标题与文摘提供的信息内容与MeSH字段提供的信息内容的近似度。通过统计各字段所有词的词频.从高频词的数量、分布及变化趋势等定量的方面,以及具体高频词和语义类型等定性方面对各字段进行对比分析。结果表明标题对文摘有很好的替代效果,标题与MeSH结合对文摘的替代效果较标题与文摘结合对MeSH的替代效果要好。
- 张云秋余睿蜚
- 关键词:非相关文献标题MESH词频语义类型
- 非相关文献知识发现的关键技术研究被引量:12
- 2008年
- 本文在对非相关文献知识发现中的关键技术进行界定的基础上,对11个国外主要的非相关文献知识发现研究中所涉及的关键技术,即初始文本集的构建、信息抽取及中间关联词的确定与排序等进行了比较研究,认为B集合质量低是非相关文献知识发现目前存在的主要问题。针对该问题,作者提出以提高B集合的质量为主要目标,从B集合形成的前过程,即初始文本集的质量以及B集合本身的质量,即B词的排序两个方面的改进策略。前者包括初始文本集的合理结构及综合过滤机制,后者包括双向词频法、基于MeSH加权和基于文献内聚力加权。并对部分改进策略进行了试验。
- 张云秋冷伏海
- 关键词:非相关文献知识发现信息抽取