姚贝
- 作品数:3 被引量:10H指数:2
- 供职机构:湖南工业大学计算机与通信学院更多>>
- 发文基金:湖南省自然科学基金国家科技支撑计划湖南省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Hadoop平台的用户行为挖掘被引量:6
- 2015年
- 随着互联网发展带来的数据爆炸,使得Web日志的数据量也越来越大,如何从海量的Web日志中挖掘有价值的信息成为了目前研究的热点。本文提出基于Hadoop集群框架对Web日志进行挖掘。实验结果表明,该集群系统既可以处理海量的web日志,同时也能够挖掘出有价值的信息,并证实了利用sqoop在Hive仓库和传统数据库之间数据迁移的可行性。
- 曾志浩姚贝张琼林孙琪
- 关键词:WEB日志HADOOP数据迁移
- 基于Mahout分布式协同过滤推荐算法分析与实现被引量:2
- 2015年
- 随着信息技术和互联网的发展,在信息过载的时代,用户面对海量的信息,难以正确选择。协同过滤推荐是个性化推荐中比较成熟的算法,但其稀疏性、冷启动、可扩展性问题仍然存在,尤其是不能应用于分布式推荐。在Hadoop平台上,Mahout实现了分布式基于项目的协同过滤推荐算法,该算法能够有效解决传统算法的海量数据处理的效率问题和可扩展性问题。实验结果表明,Mahout上基于项目的协同过滤推荐算法具有较好的计算高效性和可扩展性。
- 曾志浩张琼林姚贝孙琪
- 关键词:推荐系统
- 一种面向连续查询的虚拟轨迹隐私保护方法被引量:2
- 2014年
- 随着全球移动定位设备的普及和网络通信技术的发展,催生出基于位置服务的应用(LBS)。享受LBS带来的便利服务的同时,用户的位置轨迹隐私保护受到严峻考验。现有的位置隐私保护方法大多针对用户单次查询设计,不能适用于连续查询;且匿名效果不佳。提出了一种采用中心服务器结构的假轨迹匿名方案,通过持续选择匿名区域内长时间所在的移动用户生成假位置点,构成虚拟轨迹的方式来混淆攻击者的判断,从而达到保护用户轨迹隐私的目的。仿真实验结果表明方法有效可行。
- 曾志浩孙琪姚贝张琼林曹钦
- 关键词:连续查询