广东省自然科学基金(S2011010000812)
- 作品数:1 被引量:2H指数:1
- 相关作者:张连明王莎更多>>
- 相关机构:湖南师范大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于标签的微博人脉网络挖掘算法和结构分析被引量:2
- 2014年
- 针对互联网微博业务的广泛应用及其对大数据挖掘和分析的影响,提出一种基于标签的微博人脉网络挖掘算法。分析该网络的结构特征,利用微博用户标签,在模糊匹配过程中计算词语之间的匹配度时,主要考虑词语语素、次序和词长3个因素。为弱化以不同用户为起点对算法准确率的影响,分别以普通用户和名人用户为起点用户,挖掘微博人脉网络数据。同时,研究微博人脉网络的结构特性,通过分析发现微博人脉网络同时具有小世界和无标度特性。实验结果表明,运用该算法对名人用户和普通用户朋友中对IT感兴趣的人进行挖掘的误差率是可接受的。其中,挖掘10个名人用户朋友时算法的平均误差率为14.08%,挖掘10个普通用户朋友时算法的平均误差率为10.63%。
- 王莎张连明
- 关键词:标签数据挖掘结构特征