朱振华
- 作品数:3 被引量:1H指数:1
- 供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 分布式数据不一致性检测的实现与优化
- 2015年
- 数据的不一致性检测是数据清洗中一个重要的主题。传统集中式数据的不一致性检测问题可以使用基于SQL的技术得到解决,而对于分布式的数据,往往面临着诸多挑战。目前研究者提出了基于函数条件依赖的不一致性检测技术对该问题进行了深入研究,将分布式不一致性检测问题转化成最优化问题,并提出了若干可行的解决算法。本文介绍了分布式数据下的基于函数条件依赖的不一致性检测问题,并实现了基于最优化问题的分布式检测算法,最后组织相关实验进行验证和改进。
- 王海洁黄沈滨朱振华
- 关键词:分布式数据条件函数依赖
- 大数据云清洗系统的设计与实现被引量:1
- 2015年
- 数据清洗是大数据中一个重要的主题。本文基于Hadoop设计并实现了一个大数据的云清洗系统。通过Map-Reduce计算模型,该系统能够检测并修复数据质量方面的各类问题。该系统包含以下特征:(1)支持数据质量方面各类问题的清洗工作;(2)数据云清洗进度可视化以及参数设置;(3)友好的数据集输入接口以及清洗后的数据集输出接口。该大数据云清洗系统对文本数据和数据库数据均是一个有效且高效的数据清洗系统。
- 黄沈滨王海洁朱振华
- 关键词:大数据数据质量MAP-REDUCE
- 计算系统电源管理研究现状
- 2015年
- 随着商业界和学术界的需求增长,传统的计算系统的发展主要集中于计算性能的提升。然而,计算系统与日俱增的能量消耗,导致了巨额电费和二氧化碳排放,使其逐渐成为计算系统发展的一大瓶颈。通过对国内外计算系统电源管理技术领域的应用和研究进行分析,总结了硬件、操作系统、虚拟化以及数据中心等各个层次上的电源管理研究的进展与核心技术,最后对全文进行了总结,阐述了电源管理技术研究在计算系统中的重要意义以及发展前景。
- 朱振华高宏
- 关键词:电源管理