您的位置: 专家智库 > >

中国科学院知识创新工程重要方向项目(KGCX1-YW-13)

作品数:14 被引量:31H指数:3
相关作者:张云泉孙相征袁良王靖王婷更多>>
相关机构:中国科学院研究生院中国科学院软件研究所中国科学院更多>>
发文基金:中国科学院知识创新工程重要方向项目国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术生物学更多>>

文献类型

  • 14篇期刊文章
  • 3篇会议论文

领域

  • 17篇自动化与计算...
  • 2篇生物学

主题

  • 2篇蛋白
  • 2篇蛋白质
  • 2篇蛋白质组
  • 2篇多核
  • 2篇白质
  • 2篇CUDA
  • 2篇GPU
  • 2篇并行计算
  • 1篇蛋白质组学
  • 1篇调度
  • 1篇动态调度
  • 1篇动态规划
  • 1篇对角线
  • 1篇多项式
  • 1篇异构
  • 1篇异构多核
  • 1篇原子操作
  • 1篇质谱
  • 1篇色谱
  • 1篇色谱峰

机构

  • 10篇中国科学院
  • 10篇中国科学院研...
  • 9篇中国科学院软...
  • 3篇中国科学院大...
  • 1篇澳门大学

作者

  • 8篇张云泉
  • 3篇孙相征
  • 3篇王靖
  • 3篇袁良
  • 2篇王功明
  • 2篇王婷
  • 2篇张法
  • 2篇刘志勇
  • 2篇孙飞
  • 1篇李焱
  • 1篇段勃
  • 1篇王宣强
  • 1篇詹科
  • 1篇刘学慧
  • 1篇解利伟
  • 1篇叶良
  • 1篇王文迪
  • 1篇刘超
  • 1篇单桂华
  • 1篇安学军

传媒

  • 4篇计算机研究与...
  • 4篇计算机科学
  • 1篇计算机工程与...
  • 1篇计算机应用研...
  • 1篇软件学报
  • 1篇计算机辅助设...
  • 1篇生物物理学报
  • 1篇中国科学:信...
  • 1篇中国化学会第...

年份

  • 1篇2015
  • 4篇2013
  • 4篇2012
  • 4篇2011
  • 3篇2010
  • 1篇2009
14 条 记 录,以下是 1-10
排序方式:
ISAF重构算法密度函数快速计算模型
2013年
球坐标系下的ISAF算法是一种新的20面体分子三维重构方法,该方法精度优于传统柱坐标系下的Fourier-Beseel算法,但其执行速度远低于Fourier-Bessel算法,严重制约了ISAF算法的实际应用.分析发现,在ISAF算法中密度函数计算是影响重构速度的主要瓶颈之一.针对上述问题,文中提出一种密度函数快速计算模型,该模型包括三个组成部分:球坐标系网格点密度函数快速计算方法、"球坐标系—直角坐标系"网格点密度函数转换方法、基于两阶段映射法的快速对称映射方法.该模型可以将密度函数计算阶段的时间复杂度由O[(LM)8]降低到O[(LM)7].采用Psv-F病毒数据进行实验,结果表明,在保证精度的前提下,该模型可以将密度函数的计算速度提高2个数量级,将三维重构整体速度提高30倍左右,并且随着数据规模的增大、重构精度的提高,该模型带来的加速比将进一步增大.
王功明张法樊莉亚孙飞刘志勇
关键词:密度函数球坐标系
HPP控制器的系统级功能验证
HPP(Hyper Parallel Processing)控制器应用在超龙一号和曙光6000节点中,提供了CPU之间的互连通路,实现了节点内统一地址空间和节点内数据通信功能。为了对HPP控制器进行有效的功能验证,设计了...
刘涛柴双勇蔺建邦弓睿安学军
关键词:插件
文献传递
基于MPI和CUDA的蛋白质定量软件的设计和分析
2013年
介绍了蛋白质定量软件的设计及测试结果,分析结果表明:P-QuantWiz软件在曙光6000的Intel集群部分,测试规模达到2048核,在256核加速比仍在增加。相对P-QuantWiz软件在单CPU运行的结果,PG-QuantWiz软件在单GPU运行的加速比为8.1,在16个GPU上运行的加速比为14.18,并行效率为89%。
詹科王靖袁良张云泉
关键词:MPICUDA
对角线稀疏矩阵的SpMV自适应性能优化被引量:4
2013年
稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用"对角线格式"有效描述矩阵的对角线分布,区别于以往通用的计算方法,CRSD通过对给定应用的对角线稀疏矩阵采样再进行特定的优化.并且在软件安装阶段,通过自适应的方法选取适合具体运行平台的最优SpMV实现.在CPU端进行多线程并行化实现时,自适应调优过程中收集的信息还被用于线程间任务划分,以实现负载平衡.同时完成CRSD存储格式在GPU端的实现,并根据GPU端计算与访存的特点进行优化.实验结果表明:在Intel和AMD的多核平台使用相同线程数的情况下,与DIA相比,使用CRSD的加速比可以达到2.37X(平均1.7X);与CSR相比,可以达到4.6X(平均2.1X).
孙相征张云泉王婷李焱袁良
关键词:GPU
基于横向局部性的多核计算模型被引量:2
2012年
片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向局部性和任务共享率概念,基于此扩展串行存储层次模型RAM(h),提出考虑任务共享率的多核并行计算模型MRAM(h)。
袁良张云泉
关键词:多核并行计算模型共享缓存
基于GPU的非标记定量软件QuantWiz并行化实现
2012年
QuantWiz是一款基于质谱的非标记定量软件,可很好地应用于定量蛋白质组学。实验数据的日益增大,使定量的计算量巨大,耗费时间长。GPU以几百GFlops甚至上TFlops的运算能力,为定量蛋白质组学这样的计算密集型应用提供了良好的加速方案。对QuantWiz软件做了深入的研究与分析,找到了软件性能的热点模块所在,提出了该软件在GPU上的加速方案———GPU-QuantWiz,并进行了实现。性能测试显示,在Tesla C1060上,该方案的平均加速比达到9.66倍,得到了良好的加速效果。同时,该方案还可以扩展到两块及以上的GPU上,具有良好的可扩展性。
费辉张云泉王靖
关键词:蛋白质组GPU并行计算
基于CUDA渲染器的顺序独立透明现象的单遍高效绘制被引量:3
2011年
提出一种顺序独立透明现象的单遍高效绘制算法.首先设计了一个基于计算统一设备架构(compute unified device architecture,简称CUDA)的可编程渲染器.该系统采用扫描线算法光栅化场景,为每个像素生成多个对应的片元,同时,在GPU(graphics processing unit)的全局内存上为每个像素分配一个数组,以存储其相应的片元.基于这个框架,提出了两种并发的片元收集及排序策略,以单遍高效地绘制顺序独立的透明现象.第1种策略利用CUDA的原子操作符atomicMin收集各个像素上对应的所有片元并按深度动态排序,在后处理中片元即可按序逐一融合;第2种策略采用CUDA的原子操作符atomicInc按光栅化顺序收集所有片元,然后在后处理中按深度排序后再逐一融合.实验结果表明,与基于传统图形管线的经典深度剥离方法相比,该方法可以更高效地绘制顺序独立的透明现象,同时生成正确的绘制效果.
黄梦成刘芳刘学慧吴恩华
关键词:图形处理器计算统一设备架构原子操作
1U9P异构多核服务器节点设计
为应对高性能计算的技术挑战,设计了一种符合超并行体系结构的HPP控制器,可以直接连接一个X86架构的AMD多核处理器和八个MIPS架构的龙芯多核处理器组成一个异构服务器节点,并为节点设计了一款1U机架式机箱,已完成的超龙...
吴冬冬解利伟安学军
关键词:异构龙芯
文献传递
ISAF重构算法基函数复杂性分析及解决方案
2011年
ISAF重构算法用于重建分子三维结构,其精度优于传统傅里叶-贝赛尔重构算法,但是复杂的基函数导致其速度很慢,严重影响该方法的推广应用,所以降低基函数复杂性十分重要.通过对ISAF重构算法基函数的复杂性进行分析,提出对应的解决方案.首先采用自然对数解决组合系数生成过程中的大数运算问题;然后为内存中的所有组合系数建立二级索引,提高其寻址速度,并且根据内存访问局部性原理把可能要用到的组合系数调入高速缓存,尽可能减少内存调入调出次数,提高访存速度;最后采用动态规划提高球谐函数计算速度,可以一次生成所有阶、所有次的球谐函数.将上述解决方案综合在一起,构建了一个基函数ISAF快速计算模型.为了验证该模型效果,采用戊肝病毒的模拟数据进行三维重构实验,并且与傅里叶-贝赛尔重构算法进行比较.实验结果表明,在不影响精度的前提下,采用该模型后ISAF重构算法的执行速度是傅里叶-贝赛尔重构算法的3倍左右,并且其加速效果随着图片数量的增加、分辨率要求的提高而增强.
王功明张法樊莉亚孙飞刘志勇
关键词:勒让德多项式球谐函数动态规划索引
P-QuantWiz:一种基于质谱的并行非标记定量软件被引量:1
2009年
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行定量软件P-QuantWiz。通过实验验证P-QuantWiz具有良好的并行效率,当进程数为32时,并行效率为63%。
胡泽林张云泉王靖张先轶
关键词:质谱色谱峰并行化
共2页<12>
聚类工具0