曹锋
- 作品数:3 被引量:111H指数:3
- 供职机构:复旦大学信息科学与工程学院计算机科学系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于图形处理器的数据流快速聚类被引量:35
- 2007年
- 在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类以及数据流簇进化分析方法.这些方法的共同特点是充分利用了GPU强大的处理能力和流水线特性.与以往具有独立框架的数据流聚类算法不同,这些基于GPU的聚类算法具有同一框架和多种聚类分析功能,为数据流聚类分析提供了统一的平台.从分析可知,数据流聚类分析的核心操作实际上就是距离计算和比较.基于这一认识,利用GPU的子素向量处理功能进行距离计算.性能验证实验是在配有Pentium IV3.4G CPU和NVIDIA GeForce 6800 GT显卡的PC上进行的.综合分析和实验结果表明,基于GPU的数据流聚类算法比传统的CPU算法平均快7倍,从而为高速数据流应用提供了良好的支持.
- 曹锋周傲英
- 关键词:数据流聚类图形处理器进化
- 基于滑动窗口的进化数据流聚类被引量:73
- 2007年
- 提出了纳伪(false positive)和拒真(false negative)两种聚类特征指数直方图分别来支持纳伪误差和拒真误差窗口的聚类分析;然后,提出一种基于滑动窗口的数据流聚类方法.该方法在占用窗口大小的次线性内存空间前提下,及时保存最近数据记录的分布状况,从而实现对滑动窗口内的数据进行聚类.此外,它还可被扩展用于N-n窗口(滑动窗口的扩展模型)的数据聚类.实验采用KDD-CUP’99和KDD-CUP’98真实数据集以及变换高斯分布的人工数据集构造进化数据流.理论分析和实验结果表明,该方法具有良好的聚类质量、较小的内存开销和快速的数据处理能力.
- 常建龙曹锋周傲英
- 关键词:聚类
- 多数据流上共享窗口连接查询的降载策略被引量:9
- 2004年
- 数据流模型作为一种新型的模型 ,在许多应用中扮演着重要的角色 基于数据流模型的查询处理技术也得到了广泛的研究 为了提高查询系统的性能 ,现有的研究成果主要可以划分为两类 :调度优化和降低负载方法 调度优化方法通过改变元组执行次序来提高查询性能 降低负载方法在负载超出系统处理能力时 ,通过减少输入流量来提高吞吐率 然而 ,同时运用这两种方法来提高查询性能的研究工作还很少 结合共享滑动窗口查询操作的调度优化方法和降低负载方法 ,提出了两种在burst环境下提高查询吞吐率的策略 :均匀降载策略和小窗口准确降载策略
- 闫莺金澈清曹锋汪恒杰周傲英
- 关键词:数据流降载调度