张俊豪
- 作品数:4 被引量:23H指数:3
- 供职机构:中国人民公安大学更多>>
- 发文基金:公安部部级科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于PageRank和用户行为的微博用户影响力评估被引量:9
- 2015年
- 微博用户在消息传播过程中起到一个至关重要的作用,具有强大影响的微博用户是舆论形成、传播引导的关键因素。为了更准确地评估微博用户的影响力,文章提出了基于Page Rank和用户行为的用户影响力评估(UIA,User Influence Assessment)算法,该算法对用户自身的活跃度和用户之间的联系度进行综合考量,通过对用户的行为分析,可以提取并量化出影响用户自身活跃度和影响用户之间联系度的相关因素,进而计算出权值分配比例。该算法既避免了Page Rank的主题漂移现象,又系统化地衡量了用户影响力,具有较高的准确性。
- 张俊豪顾益军张士豪
- 关键词:PAGERANK用户行为活跃度联系度
- 微博自动分类系统设计被引量:5
- 2016年
- 文章提出了一种热门微博分类的新思路,通过对热门微博的转发用户进行聚类分析,并根据不同的用户聚集状态来区分不同种类的热门微博。在用户聚类中采用了基于K-means聚类算法的改进算法X-means,并根据微博用户数据特点对X-means算法进行了进一步改进,将属性差异和用户节点差异考虑在聚类过程当中。其中,在对X-means算法改进过程中,对于用户属性的加权采用了基于对数函数的加权方式,确保聚类结果更加科学、准确;在对用户自身权重的加权中,通过建立重点人员信息库的方式,实现了对特殊用户节点的加权,并利用HITS算法对重点人员信息库实现动态更新。在完成用户聚类之后,将得到的重要用户的信息分领域录入重点人员信息库,实现聚类过程与信息库的反馈机制。另外,实验将相同数据分别代入改进前后的K-means算法与X-means算法中,并通过轮廓系数评价聚类结果,证明了改进后的X-means算法在微博用户聚类中更有优势。
- 张士豪顾益军张俊豪
- 关键词:用户聚类
- 基于用户聚类的热门微博分类研究被引量:10
- 2015年
- 文章在已有的微博分类研究的基础上,提出一种基于热门微博下转发用户聚类的微博分类方法,使得分类结果能够在公安工作中有更大的利用价值。文章所使用的聚类算法采用了现如今比较成熟的K-means聚类算法以及对其进行改进之后的X-means聚类算法,X-means算法使用了更加科学的BIC准则作为类别之间的相似性度量,而且用户在使用X-means算法时无需再指定聚类个数,只需要划定聚类范围就可以了,通过这样的机制,X-means算法提高了聚类的准确性和科学性。经过对实验结果的对比分析,发现X-means算法得出的聚类结果拟合性更好。因此,在微博分类研究中将会使用X-means算法进行用户聚类。另外,文章还列举了不同种类的微博下的用户聚集情况,并为网络安全主管部门提出了针对不同种类微博的应对策略。
- 张士豪顾益军张俊豪
- 关键词:用户聚类
- 基于距离模型的用户关系强度评估被引量:2
- 2015年
- 对微博用户关系强度的评估是分析和研究微博网络的基础。文章提取微博用户的个人基本信息、交互信息、互粉信息,并提出一种基于距离的评估模型对微博用户的关系强度进行准确的评估分类,该距离模型根据三种假设,得出最基础的用户关系强度群,然后根据距离函数对未知的关系强度进行分类。由此得出一张有向加权图,节点表示微博用户,边表示用户之间的关注关系,权值表示微博用户之间的关系强度。将该距离模型得出的预测结果和采用对用户相对交流值,用户背景的相似度和用户是否互粉三种属性值进行加权融合得出的实验结果进行比较分析可得出:该评估模型能够结合用户的综合信息评估出用户之间的关系强度,结果全面、准确、直观,也充分说明该模型既吸取了加权融合法的优点,也避免了加权融合的弊端,很好的体现了机器学习的优势,为微博舆论的研判提供最直接的参考依据。
- 张俊豪顾益军张士豪
- 关键词:加权有向图