您的位置: 专家智库 > >

国家自然科学基金(60773216)

作品数:2 被引量:6H指数:1
相关作者:姜芳艽薛鸿鹄高洁杨楠刘秀德更多>>
相关机构:中国人民大学徐州师范大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇理学

主题

  • 2篇链接
  • 2篇链接分析
  • 2篇抽取
  • 1篇英文
  • 1篇聚类
  • 1篇二分图
  • 1篇WEB
  • 1篇WEB社区
  • 1篇ZIPF分布
  • 1篇层次聚类
  • 1篇抽取方法

机构

  • 3篇中国人民大学
  • 1篇徐州师范大学

作者

  • 2篇杨楠
  • 1篇刘秀德
  • 1篇刘悦
  • 1篇姜芳艽
  • 1篇高洁
  • 1篇薛鸿鹄
  • 1篇丁晖

传媒

  • 1篇计算机科学
  • 1篇Journa...

年份

  • 2篇2010
  • 1篇2008
2 条 记 录,以下是 1-3
排序方式:
Web社区紧密核的抽取方法
针对采用紧密二分图来抽取社区核的(α,β)密度方法和γ-dense密度方法进行了分析,指出了存在的问题.提出紧密二分图块的概念和采用2步骤构造二分图的方法,减少不必要节点和边的扩展.提出最大紧密二分图块的概念和抽取算法....
杨楠丁晖刘悦
关键词:WEB社区链接分析
文献传递
Web紧密核的抽取和评价方法(英文)被引量:1
2008年
针对web社区的发现和链接分析技术的一些关键问题,基于面向主题的技术,重点研究了二分图的特征,引入了x二分核集来更为明确地定义抽取的方法.通过扫描主题子图构造x二分图,对该子图的(i,j)裁剪后得到x二分核集,这也是社区的最小元素.最后,对所抽取的所有x二分核集应用层次聚类的方法得到社区内部结构的树状图,证明了构造和裁剪方法的正确性并设计了算法.实验采用HITS(hyperlink-induced topic search)算法中的典型数据集获取方法,选择了10个主题和4个搜索引擎并综合返回的结果.采用社会网中测量社区结构强度的模块化度量来验证所提方法的有效性,实验结果表明所提方法是有效并可行的.
杨楠高洁薛鸿鹄刘秀德
关键词:链接分析层次聚类
基于Zipf分布与属性相关性的选择性估计被引量:5
2010年
在DeepWeb数据集成中,集成查询接口和很多Web数据库查询接口用合取谓词表达查询,但是也有相当一部分Web数据库的查询接口用互斥谓词表达查询,这意味着查询转换时每次只能选择一个谓词。因此,准确、高效地估计每个互斥查询的选择性是优化查询转换的关键。提出了基于Zipf分布与属性相关性的选择性估计方法。通过属性之间的相关性从Web数据库上获取该属性近似随机的属性级样本,在此基础上计算属性值的Zipf分布方程,进而推断该无限值属性的任意值的选择性。实验表明,该方法可以准确、高效地估计各互斥查询的选择性。
姜芳艽
关键词:ZIPF分布
共1页<1>
聚类工具0