公共文化服务平台

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

龙芯3A多核处理器系统级性能优化与分析被引量：12: 2012年; 多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还要结合处理器特性产生高效运行的代码,其性能好坏直接影响着系统的整体性能.为了提高龙芯3A系统的实际性能,从操作系统和编译器着手,结合龙芯3A微结构特征,进行了一系列有效的优化.这些措施包括CC-NUMA多核操作系统的实现、操作系统二级Cache锁机制、操作系统调度共享二级Cache分配、自动向量化编译和支持预取机制的编译等.实验结果表明,在系统软件中增加对处理器特性的支持,能够充分挖掘体系结构的优势,对系统性能有较大的好处.其性能优化技术对于其他处理器的优化也有一定的借鉴价值.; 孟小甫高翔从明张爽爽; 关键词：龙芯3A 自动向量化性能分析

龙芯UNCACHE加速原理及其在系统图形性能优化中的应用被引量：2: 2015年; 针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU（中心处理单元）访问GPU（图形处理单元）存储空间数据传输延迟较大的瓶颈，采用了龙芯GS464处理器核心实现的UA（uncache acceleration）机制对GPU驱动程序中的GPU存储空间访问接口进行优化，极大地提高了处理器向GPU等IO存储空间连续数据写入的速度。详细分析了龙芯处理器uA机制的原理及其相对于uncache方式IO写所能带来的性能提升。通过UA机制优化了龙芯3A＋2H平台的GPU驱动性能，x11perf测试结果显示，采用UA优化GPU驱动后，Xserver的一些接口性能提升达5％～230％。将龙芯处理器的UA机制封装到了标准MMAP系统调用，并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口，实验结果显示，播放常见较高分辨率视频时该接口性能能够有6～12倍的性能提升。; 张爽爽孟小甫汪文祥高翔; 关键词：UA 图像

全选清除导出

共1页<1>

张爽爽