上海市教育委员会创新基金(08ZZ76)
- 作品数:3 被引量:17H指数:2
- 相关作者:陈庆奎张佳康郭静徐文杰更多>>
- 相关机构:上海理工大学更多>>
- 发文基金:上海市教育委员会创新基金上海市教育委员会重点学科基金上海市教育发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于CUDA技术的卷积神经网络识别算法被引量:9
- 2010年
- 针对具有高浮点运算能力的流处理器设备GPU对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一设备架构(CUDA)技术,并定义其上的并行化数据结构,描述计算任务到CUDA的映射机制。实验结果证明,在GTX200硬件架构的GPU上实现的并行识别算法的平均浮点运算能力峰值较CPU上串行算法提高了近60倍,更适用于神经网络的相关应用。
- 张佳康陈庆奎
- 关键词:流处理器卷积神经网络
- 基于CUDA的快速图像压缩被引量:6
- 2010年
- 为了进一步提高JPEG编码效率,对JPEG压缩算法进行研究,分析得出JPEG核心步骤可以并行化处理。因此,实现平台宜采用以并行计算为优势的GPU,而不是以串行计算为主的CPU。NVIDIA新推出的CUDA(计算统一设备架构)为此实现提供了软硬件环境。CUDA是基于GPU进行通用计算的开发平台,非常适合大规模的并行数据计算。在GPU流处理器架构下用CUDA技术实现编码并行化,并针对流处理器架构特点进行内存读写等方面的优化,提高了JPEG编码的速度。实验结果表明了CUDA技术在并行处理方面的优越性,JPEG编码效率得到了极大提高。
- 郭静陈庆奎
- 关键词:JPEG并行处理计算统一设备架构流处理器GPU
- 基于余弦向量法的Web数据并行抓掘系统被引量:2
- 2009年
- 为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并行算法。理论分析和实验表明,基于余弦向量匹配算法的挖掘任务分配模型具有良好的分配适应性和负载平衡性。
- 徐文杰陈庆奎
- 关键词:计算机机群