戴新华
- 作品数:2 被引量:3H指数:1
- 供职机构:南京邮电大学计算机学院更多>>
- 发文基金:江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce数据密集型负载调度策略研究被引量:2
- 2015年
- 针对云计算环境中大规模数据集的处理,MapReduce集群已成为一个强大的处理平台。文中提出了一种基于虚拟化平台动态资源重配置的资源评价和动态资源重新配置调度算法。该算法动态地评估作业在截止时间内完成所需要的Map和Reduce计算资源数量,并在不违反用户设定的时间目标的情况下,通过动态地增加或减少独立虚拟机的方式来调整CPU资源,以实现提高数据本地性,同时提高系统在运行作业时的资源利用率。仿真实验结果表明,该算法可以使集群上的MapReduce作业的吞吐率有明显的提高。
- 秦军童毅戴新华林巧民
- 关键词:云计算MAPREDUCEHADOOP
- 基于MapReduce的SVM分类算法研究被引量:1
- 2015年
- 云计算环境中,传统的基于MapReduce的SVM分类算法对数据集的训练是将各子节点训练后得到的支持向量进行合并,得到的分类器分类效率和准确率不理想。为此,文中提出了一种改进的训练算法,在各节点上运用遗传算法来寻找子数据集的最优核函数及参数,用得到的参数组合对子数据集进行训练得到支持向量,合并每个节点训练后的支持向量为全局支持向量,然后在各个节点上将子集与全局支持向量合并作为新的训练数据集。重复这四个步骤,直到全局支持向量不再变化时,则收敛到最优分类模型。最后,经开源云计算平台Hadoop实验验证,该算法的分类正确率比传统的分类算法有了明显提高。
- 秦军戴新华童毅林巧民
- 关键词:MAPREDUCE遗传算法云计算