您的位置: 专家智库 > >

黄虎才

作品数:10 被引量:35H指数:4
供职机构:西安邮电大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 9篇自动化与计算...
  • 1篇电子电信

主题

  • 4篇多态
  • 4篇并行计算
  • 3篇多核
  • 3篇阵列机
  • 3篇图像
  • 3篇图像处理
  • 3篇处理器
  • 2篇预处理
  • 2篇图形处理器
  • 2篇图形渲染
  • 2篇渲染
  • 2篇线程
  • 2篇线程级并行
  • 2篇GPU
  • 2篇并行机
  • 1篇多模式
  • 1篇硬件
  • 1篇硬件体系
  • 1篇硬件体系结构
  • 1篇阵列

机构

  • 10篇西安邮电大学
  • 3篇西安电子科技...
  • 1篇西安微电子技...

作者

  • 10篇黄虎才
  • 6篇韩俊刚
  • 6篇李涛
  • 3篇杜慧敏
  • 2篇黄光新
  • 2篇沈绪榜
  • 2篇乔虹
  • 1篇邢立冬
  • 1篇杨婷
  • 1篇钱博文
  • 1篇蒲林
  • 1篇山蕊
  • 1篇邓军勇
  • 1篇王鹏博
  • 1篇刘镇弢
  • 1篇蒋林
  • 1篇姚静
  • 1篇殷诚信
  • 1篇马栋

传媒

  • 2篇西安电子科技...
  • 2篇西安邮电大学...
  • 1篇计算机工程与...
  • 1篇计算机辅助设...
  • 1篇计算机与数字...
  • 1篇中国图象图形...

年份

  • 2篇2019
  • 1篇2017
  • 3篇2015
  • 3篇2014
  • 1篇2013
10 条 记 录,以下是 1-10
排序方式:
多态并行机上的3D图形渲染被引量:7
2015年
针对多态同构阵列处理器,提出一种图形算法并行化的实现方法。该方法通过分析图形流水线中渲染算法的控制依赖、数据依赖关系,并对各个算法计算量进行估计,利用多态阵列处理机的能够结合不同类型的并行计算的特点,以处理器的负载均衡为依据,实现图形渲染的并行化计算。实验结果表明,该方法所实现的加速比按线性增长。
韩俊刚姚静李涛黄虎才乔虹延酉玫王鹏博
关键词:并行计算图形渲染数据并行
3D图形渲染的能耗估计被引量:1
2017年
针对硬件设计和图形编程,提出了一种新的三维图形渲染计算阶段的能耗估计模型.针对三维渲染管线中顶点着色器和像素着色器的能耗问题,对影响渲染质量的顶点着色和像素着色的负载进行了分析,得出了像素数与顶点数的比值模型;同时,对顶点着色阶段和像素着色阶段的能耗进行了建模.用所建立的模型对基准测试程序进行了能耗估计,使用Synopsys VCS(Verilog Compiled Simulator)仿真器和Power Compiler来执行仿真,得到不同测试程序的实际能耗.验证结果表明,该模型预测误差的几何平均值小于3%,达到了较高的估计精度,可用于指导图形硬件和软件的功耗分析和管理.
邢立冬李涛黄虎才韩俊刚
关键词:着色器
多核并行访问纹理单元的预处理方法被引量:1
2019年
在基于tile渲染的多核GPU中,各个处理器并行处理tile内场景。当场景中出现大量重复纹理数据时,不同tile内会采样相同的纹理坐标,导致纹理单元对相同纹理进行重复处理。针对此类情况,论文提出了两种处理方法,即固定处理模式与预处理模式。方法二对方法一进行优化,具有合并相同访问请求的功能。方法二通过对纹理数据采样请求的两次比较,解决了同一时刻与某段时间内多核出现相同纹理数据采样请求的情况,减少了纹理单元重复冗余的操作和功耗,提升了纹理映射的速度。
刘世豪杜慧敏黄虎才王可卢通
关键词:GPU多核预处理
MIGPU-9多核交互式图形处理器的设计被引量:11
2014年
鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理器VSP、双模式的剪裁投影处理器PCPTC,以及数个像素染色处理器PSP等共计9个微处理器核;MIGPU-9将这9个具有不同功能和不同结构的微处理器核以及各种专用加速电路以双轨握手的流水线形式集成到一块XC6VLX550T FPGA上,实现了图形处理任务在不同处理器核及专用电路上的并行计算.测试结果表明,MIGPU-9支持OpenGL2.0和DirectDraw,像素填充率最高可达40 M/s,电路规模超过527万门.
邓军勇李涛蒋林韩俊刚杜慧敏沈绪榜黄光新常立博山蕊黄虎才马栋
关键词:图形处理器
并行扫描转换结构中的状态管理
2013年
扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元的停顿,降低系统的吞吐能力。提出一种新的状态管理方法,将命令分为计算与控制两类,对于控制类的命令由状态处理单元生成状态掩模(state-mask),减少了状态管理中的广播通信,降低了保持命令顺序性和状态管理的复杂性。仿真结果表明所提出状态管理方法同传统的状态管理方法相比,在游戏等后端状态变化明显的图形应用中,扫描引擎利用率提高了5%~9%。
殷诚信韩俊刚黄虎才
关键词:图形处理器并行处理
一种用于实时图像处理的众核结构设计被引量:4
2015年
基于数据流模型和硬件可重构技术,提出了一种面向图像处理应用的可重构的多模式众核处理器结构.处理器采用了可扩展的层次化阵列结构,分布式共享存储和带硬件握手的近邻互连,可以分区并发实现多种并行模式,并克服了传统处理器实现数据流计算的低效性;基于VC++开发了集成仿真平台,用于对结构性能和指令性能的仿真验证,并在现场可编程门阵列上实现了包含64个处理单元的所提结构.仿真结果表明,所提结构实现了超过图形处理单元的性能以及接近专用集成电路的数据吞吐量.
刘镇弢李涛黄虎才韩俊刚沈绪榜
关键词:数据流并行计算
萤火虫2:一种多态并行机的硬件体系结构被引量:16
2014年
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。
李涛杨婷易学渊蒲林钱博文黄光新黄虎才韩俊刚
关键词:阵列机计算机图形线程级并行
基于PAAG的图像处理算法并行化设计
2015年
针对图形处理中的Gamma校正算法和平均滤波算法,在多态并行阵列机上进行并行化设计。该设计利用多线程调度模式将算法中不相关程序分为多个线程相互填充,减少线程的阻塞等待时间,最后将多线程程序映射到阵列机上实现算法的并行化。仿真结果表明,Gamma校正算法在单线程下运行消耗时间是多线程的3.5倍,平均滤波算法在单线程下运行消耗时间是多线程的2.2倍。
李涛乔虹黄虎才
关键词:并行计算图像处理算法
多态阵列处理器的并行计算研究
通过在单个芯片上集成成千上万个简单处理核来获得高性能和高吞吐量,已成为目前计算机体系结构研究的热点。虽然众核芯片上的单个简单处理核不具备复杂控制逻辑,在开发指令级并行方面存在很多难点,但是同一芯片上的众多简单处理核协同工...
黄虎才
关键词:并行计算线程级并行指令级并行图像处理
文献传递
多核并行访问纹理单元的预处理方法
在基于tile渲染的多核GPU中,各个处理器并行处理tile内场景。当场景中出现大量重复纹理数据时,不同tile内会采样相同的纹理坐标,导致纹理单元对相同纹理进行重复处理。针对此类情况,论文提出了两种处理方法,即固定处理...
刘世豪杜慧敏黄虎才王可卢通
关键词:GPU多核预处理
共1页<1>
聚类工具0