您的位置: 专家智库 > >

张爽爽

作品数:2 被引量:14H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家科技重大专项国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇龙芯
  • 1篇性能分析
  • 1篇图像
  • 1篇自动向量化
  • 1篇向量
  • 1篇向量化
  • 1篇龙芯3A
  • 1篇UA
  • 1篇处理器
  • 1篇CACHE

机构

  • 2篇中国科学院
  • 1篇中国科学院研...
  • 1篇中国科学院大...
  • 1篇龙芯中科技术...

作者

  • 2篇孟小甫
  • 2篇张爽爽
  • 1篇高翔
  • 1篇从明
  • 1篇汪文祥

传媒

  • 1篇计算机研究与...
  • 1篇高技术通讯

年份

  • 1篇2015
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
龙芯3A多核处理器系统级性能优化与分析被引量:12
2012年
多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还要结合处理器特性产生高效运行的代码,其性能好坏直接影响着系统的整体性能.为了提高龙芯3A系统的实际性能,从操作系统和编译器着手,结合龙芯3A微结构特征,进行了一系列有效的优化.这些措施包括CC-NUMA多核操作系统的实现、操作系统二级Cache锁机制、操作系统调度共享二级Cache分配、自动向量化编译和支持预取机制的编译等.实验结果表明,在系统软件中增加对处理器特性的支持,能够充分挖掘体系结构的优势,对系统性能有较大的好处.其性能优化技术对于其他处理器的优化也有一定的借鉴价值.
孟小甫高翔从明张爽爽
关键词:龙芯3A自动向量化性能分析
龙芯UNCACHE加速原理及其在系统图形性能优化中的应用被引量:2
2015年
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度。详细分析了龙芯处理器uA机制的原理及其相对于uncache方式IO写所能带来的性能提升。通过UA机制优化了龙芯3A+2H平台的GPU驱动性能,x11perf测试结果显示,采用UA优化GPU驱动后,Xserver的一些接口性能提升达5%~230%。将龙芯处理器的UA机制封装到了标准MMAP系统调用,并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口,实验结果显示,播放常见较高分辨率视频时该接口性能能够有6~12倍的性能提升。
张爽爽孟小甫汪文祥高翔
关键词:UA图像
共1页<1>
聚类工具0