您的位置: 专家智库 > >

上海市教育委员会创新基金(08ZZ76)

作品数:3 被引量:17H指数:2
相关作者:陈庆奎张佳康郭静徐文杰更多>>
相关机构:上海理工大学更多>>
发文基金:上海市教育委员会创新基金上海市教育委员会重点学科基金上海市教育发展基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇流处理器
  • 2篇处理器
  • 1篇多线程
  • 1篇神经网
  • 1篇神经网络
  • 1篇数据并行
  • 1篇网络
  • 1篇线程
  • 1篇卷积
  • 1篇卷积神经网络
  • 1篇机群
  • 1篇计算机
  • 1篇计算机机群
  • 1篇计算统一设备...
  • 1篇架构
  • 1篇WEB
  • 1篇CUDA
  • 1篇GPU
  • 1篇JPEG
  • 1篇并行处理

机构

  • 3篇上海理工大学

作者

  • 3篇陈庆奎
  • 1篇徐文杰
  • 1篇郭静
  • 1篇张佳康

传媒

  • 2篇计算机工程
  • 1篇计算机工程与...

年份

  • 2篇2010
  • 1篇2009
3 条 记 录,以下是 1-3
排序方式:
基于CUDA技术的卷积神经网络识别算法被引量:9
2010年
针对具有高浮点运算能力的流处理器设备GPU对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一设备架构(CUDA)技术,并定义其上的并行化数据结构,描述计算任务到CUDA的映射机制。实验结果证明,在GTX200硬件架构的GPU上实现的并行识别算法的平均浮点运算能力峰值较CPU上串行算法提高了近60倍,更适用于神经网络的相关应用。
张佳康陈庆奎
关键词:流处理器卷积神经网络
基于CUDA的快速图像压缩被引量:6
2010年
为了进一步提高JPEG编码效率,对JPEG压缩算法进行研究,分析得出JPEG核心步骤可以并行化处理。因此,实现平台宜采用以并行计算为优势的GPU,而不是以串行计算为主的CPU。NVIDIA新推出的CUDA(计算统一设备架构)为此实现提供了软硬件环境。CUDA是基于GPU进行通用计算的开发平台,非常适合大规模的并行数据计算。在GPU流处理器架构下用CUDA技术实现编码并行化,并针对流处理器架构特点进行内存读写等方面的优化,提高了JPEG编码的速度。实验结果表明了CUDA技术在并行处理方面的优越性,JPEG编码效率得到了极大提高。
郭静陈庆奎
关键词:JPEG并行处理计算统一设备架构流处理器GPU
基于余弦向量法的Web数据并行抓掘系统被引量:2
2009年
为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并行算法。理论分析和实验表明,基于余弦向量匹配算法的挖掘任务分配模型具有良好的分配适应性和负载平衡性。
徐文杰陈庆奎
关键词:计算机机群
共1页<1>
聚类工具0