您的位置: 专家智库 > >

广东省自然科学基金(S2011010000812)

作品数:1 被引量:2H指数:1
相关作者:张连明王莎更多>>
相关机构:湖南师范大学更多>>
发文基金:国家自然科学基金广东省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据挖掘
  • 1篇结构特征
  • 1篇基于标签
  • 1篇标签

机构

  • 1篇湖南师范大学

作者

  • 1篇王莎
  • 1篇张连明

传媒

  • 1篇计算机工程

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于标签的微博人脉网络挖掘算法和结构分析被引量:2
2014年
针对互联网微博业务的广泛应用及其对大数据挖掘和分析的影响,提出一种基于标签的微博人脉网络挖掘算法。分析该网络的结构特征,利用微博用户标签,在模糊匹配过程中计算词语之间的匹配度时,主要考虑词语语素、次序和词长3个因素。为弱化以不同用户为起点对算法准确率的影响,分别以普通用户和名人用户为起点用户,挖掘微博人脉网络数据。同时,研究微博人脉网络的结构特性,通过分析发现微博人脉网络同时具有小世界和无标度特性。实验结果表明,运用该算法对名人用户和普通用户朋友中对IT感兴趣的人进行挖掘的误差率是可接受的。其中,挖掘10个名人用户朋友时算法的平均误差率为14.08%,挖掘10个普通用户朋友时算法的平均误差率为10.63%。
王莎张连明
关键词:标签数据挖掘结构特征
共1页<1>
聚类工具0