国家高技术研究发展计划(2010AA012504)
- 作品数:3 被引量:29H指数:3
- 相关作者:张宏莉张玥卢珺珈张伟哲更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于BBS的热点话题发现与态势预测技术的研究被引量:13
- 2012年
- 网络论坛BBS是中国网民一个重要的信息传播渠道,而其中的热点话题自然就成为舆情调控和效果评估的首要目标。提出一个快速有效的用于挖掘网络论坛中热点话题并分析预测其发展态势的方法,利用统计的方法为同一版面下帖子的热度打分并排序,并使用相关的数学模型对热度较高的帖子的发展态势进行分析与预测。通过实验验证了该模型的可行性和有效性,为进一步研究复杂网络中热点话题的演化奠定了基础。
- 卢珺珈张宏莉张玥
- 关键词:BBS
- 基于幂律分布的网络用户快速排序算法被引量:5
- 2012年
- 随着网络论坛、博客、微博的发展,引出社会网络中的用户排序问题。将在线网络论坛中用户映射为节点,用户评论过程中形成的回复关系映射为有向关联图,其节点度符合幂律分布。且论坛中用户的主题发布行为和回复关系符合Pagerank算法的互增强和随机游走特性,因此选用Pagerank算法排序用户影响力。该文提出的研究问题:如何提高用户排序应用中数据的存储和运行效率。天涯网络论坛中80%以上用户入度为0,据此,根据入度是否为0划分为两个集合,对入度为0集合按出度构造链接表,设计了基于集合划分的高效排序算法SD-Rank。SD-Rank时空复杂性为O(V′),V′为入度非0节点集。对天涯网络论坛真实用户数据的实验结果表明:SD-Rank算法时空复杂性优于Pagerank算法。
- 张玥张宏莉张伟哲
- 关键词:幂律入度
- 识别网络论坛中有影响力用户被引量:11
- 2013年
- 网络论坛已经成为网络用户发布信息的重要渠道.在论坛中对热点话题的讨论影响着物理世界中人们的看法、观点以及国家政策法规的制定.由此提出一系列研究问题:如何计算用户影响力?不同主题不同时间下用户影响力如何比较?用户影响力发展趋势如何?根据幂律规律,大量用户形成"长尾",如何识别有影响力用户?以主题为单位,提取用户间回复关系,构建用户对话关联图,回复次数和回复长度形成用户行为特征,入度和出度形成网络结构特征.在Pagerank算法基础上,结合用户行为特征以及用户间关联网络特征,提出基于多属性的用户影响力排序算法(multiple attributes rank,MAR).并依据发表时间进行时间段切分,得到论坛上每日有影响力用户排行榜,进一步分析了有影响力用户演化趋势.以天涯网络论坛真实数据进行实验,从多角度评价有影响力用户以及MAR排序算法,得到一些有趣结论并对未来工作进行了展望.
- 张玥张宏莉张伟哲卢珺珈
- 关键词:网络论坛排序用户行为关联网络