您的位置: 专家智库 > >

朱蔷蔷

作品数:3 被引量:10H指数:2
供职机构:天津师范大学计算机与信息工程学院更多>>
发文基金:天津市科技支撑计划重点项目博士科研启动基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇HADOOP
  • 1篇电影
  • 1篇数据集
  • 1篇相似度
  • 1篇相似度计算
  • 1篇协同过滤
  • 1篇协同过滤算法
  • 1篇个性化推荐
  • 1篇REDUCE
  • 1篇HADOOP...
  • 1篇MAPRED...
  • 1篇MAPRED...
  • 1篇词组
  • 1篇MAP

机构

  • 2篇天津师范大学
  • 1篇河北大学

作者

  • 3篇刘文龙
  • 3篇朱蔷蔷
  • 3篇张桂芸
  • 1篇陈喆

传媒

  • 2篇郑州大学学报...
  • 1篇哈尔滨师范大...

年份

  • 3篇2012
3 条 记 录,以下是 1-3
排序方式:
基于Hadoop平台上面向电影数据集Kmeans算法的改进被引量:2
2012年
针对聚类算法并行化的需求,该文对基于Hadoop平台Kmeans算法进行了改进,选用Canopy算法对数据进行预处理,并在具有一定数据结构的电影数据集上进行了单机对比实验,集群加速比实验和集群扩展率实验,分别体现改进后算法实现的高效性、良好的加速比和可扩展性,从而可以有效地运用在实际海量数据挖掘中.
朱蔷蔷张桂芸刘文龙
关键词:HADOOPMAPREDUCE
基于MapReduce框架一种文本挖掘算法的设计与实现被引量:4
2012年
随着文本挖掘在主动信息服务中应用的日益扩展,在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势,本文在Hadoop平台上设计并实现了一种文本挖掘算法,该算法利用Ma-pReduce框架按照自然语料中相邻词组出现的频数进行降序输出,从而有助于用户挖掘大量数据中各项集之间的联系,实验结果体现了该算法的有效性和良好的加速比.
朱蔷蔷张桂芸刘文龙
关键词:HADOOPMAPREDUCE
基于加权信息熵相似性的协同过滤算法被引量:4
2012年
协同过滤算法是推荐系统中最为成功的技术之一,相似性计算是协同过滤算法的核心.针对传统的相似度计算方法在数据稀疏的情况下推荐不准确问题,提出了基于项目间差异信息熵的相似度计算方法,先通过差异值和共同评价数目对信息熵进行加权,再归一化处理来计算项目间的相似度.用基于项目(Item-based)相似性的协同过滤算法进行了实验验证,实验结果表明,该算法提高了个性化推荐精度.
刘文龙张桂芸陈喆朱蔷蔷
关键词:相似度计算协同过滤个性化推荐
共1页<1>
聚类工具0