您的位置: 专家智库 > >

刘颖

作品数:24 被引量:78H指数:3
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 12篇专利
  • 7篇期刊文章
  • 3篇会议论文
  • 1篇学位论文
  • 1篇科技成果

领域

  • 15篇自动化与计算...

主题

  • 6篇异构
  • 6篇处理器
  • 4篇冗余
  • 4篇神威
  • 4篇太湖
  • 4篇内存
  • 4篇编程
  • 4篇编译器
  • 3篇代码
  • 3篇硬件
  • 2篇带宽
  • 2篇带宽利用率
  • 2篇代码优化
  • 2篇多核
  • 2篇异构平台
  • 2篇硬件平台
  • 2篇优化技术
  • 2篇运行性
  • 2篇运行性能
  • 2篇冗余计算

机构

  • 24篇中国科学院
  • 4篇华为技术有限...
  • 3篇山东科技大学
  • 2篇中国科学院大...
  • 1篇哈尔滨工程大...
  • 1篇北京大学
  • 1篇西华师范大学
  • 1篇中科寒武纪科...

作者

  • 24篇刘颖
  • 11篇冯晓兵
  • 8篇黄磊
  • 7篇吕方
  • 7篇崔慧敏
  • 5篇卢廷玉
  • 3篇陈莉
  • 2篇李星
  • 2篇唐生林
  • 2篇连瑞琦
  • 2篇王晨曦
  • 1篇何先波
  • 1篇王蕾
  • 1篇赵家程
  • 1篇常宝宝
  • 1篇刘群
  • 1篇李丰
  • 1篇霍玮
  • 1篇吴艳霞
  • 1篇胡丹琪

传媒

  • 2篇计算机学报
  • 1篇计算机工程与...
  • 1篇高技术通讯
  • 1篇中文信息学报
  • 1篇计算机科学
  • 1篇山东科技大学...
  • 1篇2014全国...
  • 1篇第十五届计算...

年份

  • 1篇2023
  • 2篇2022
  • 2篇2021
  • 4篇2020
  • 5篇2019
  • 2篇2018
  • 3篇2015
  • 1篇2014
  • 2篇2011
  • 2篇1998
24 条 记 录,以下是 1-10
排序方式:
基于代码融合编译框架的OpenCL编译器设计方法和系统
本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统,包括:基于共享内存提供主机‑内核代码融合编译框架,在编译器的中间表示——AST层上实现不同端代码的融合;WII‑CFG图用来刻画Kernel代码被实例...
刘颖黄磊伍明川崔慧敏冯晓兵
文献传递
异构数据中心中自适应编程环境技术的研究与应用
冯晓兵赵家程崔慧敏刘颖王蕾吕方陈莉唐生林霍玮李丰衷璐
随着云计算、互联网与物联网技术的快速发展,数据中心已经成为核心的计算和服务提供方。而伴随着大数据处理、高通量计算、人工智能等多样化应用在数据中心的广泛部署,传统的通用处理器难以满足来自于应用的性能、功能、延迟的多维度需求...
关键词:
关键词:数据处理方法
关于多核/众核系统可扩展性趋势的探讨
主流的多核/众核并行系统的计算能力并非与其资源成正比,其可扩展性与架构、资源部署等均有一定联系.除此之外,来自核心软件——操作系统以及并行运行时库的影响也是不可忽视的,硬件结构与核心软件将共同影响并行系统性能的充分发挥....
李星吕方刘颖冯晓兵
关键词:并行处理器多核结构可扩展性
文献传递
一种面向便笺式存储器的带宽感知循环分块优化方法、编译系统、设备及存储介质
本发明提出了一种面向便笺式存储器的带宽感知循环分块优化技术,该技术通过协调考虑带宽利用率和片上存储器容量来增强传统的循环分块优化方法。根据针对DMA的测试分析得到的带宽行为模型,创建决策树以针对不同类型的数据访问模式,从...
伍明川刘颖崔慧敏韦清福黎权锋李立民吕方冯晓兵
一种数据存储方法和装置
本发明的实施例提供一种数据存储的方法和装置,应用于计算机领域,能够支持混合内存中待存储数据的存储。所述数据存储方法用于编译器,包括:判断待存储数据的数据类型;若所述待存储数据的数据类型是预设数据类型,获取所述待存储数据贡...
卢廷玉刘颖
文献传递
一种消息访存的编译方法及相关装置
本发明实施例公开了一种消息访存的编译方法,包括:获取消息式内存的访存序列;确定所述访存序列中各个访存节点的节点属性;根据所述节点属性对访存节点的数据存储位置进行调整,使得节点属性相同的访存节点的数据存储位置连续。
卢廷玉刘颖赵洪建
深度学习FPGA加速器的进展与趋势被引量:57
2019年
随着大数据时代的来临,深度学习技术在从海量数据中提取有价值信息方面发挥着重要作用,已被广泛应用于计算机视觉、语音识别及自然语言处理等领域.本文从深度学习算法的特点和发展趋势出发,分析FPGA加速深度学习的优势以及技术挑战;其次,本文从SoC FPGA和标准FPGA两个方面介绍了CPU-FPGA平台,主要对比分析了两种模型在CPU和FPGA之间数据交互上的区别;接下来,在介绍FPGA加速深度学习算法开发环境的基础上,重点从硬件结构、设计思路和优化策略这三个方面详细介绍了采用FPGA加速卷积神经网络的设计方案;最后展望了FPGA加速深度学习算法相关研究工作的发展.
吴艳霞梁楷刘颖崔慧敏
关键词:神经网络硬件加速FPGA
一种线程间冗余删除的异构编译优化方法
本发明通过自动选择优化策略以及分维度进行线程间冗余删除的收益代价分析,能自动根据代码是否含有同步操作和硬件平台的特点,针对性地选择一种优化策略,通过对Kernel代码的编译分析,得出合适的合并维度和合并因子,利于提高Ke...
黄磊刘颖伍明川洪锐冯晓兵
文献传递
一种数据存储方法和装置
本发明的实施例提供一种数据存储的方法和装置,应用于计算机领域,能够支持混合内存中待存储数据的存储。所述数据存储方法用于编译器,包括:判断待存储数据的数据类型;若所述待存储数据的数据类型是预设数据类型,获取所述待存储数据贡...
卢廷玉刘颖
文献传递
面向龙芯处理器的高性能编译系统
龙芯编译系统是面向国产高性能通用处理器芯片——龙芯的具有高性能、高可靠性的交叉编译系统及工具链,该系统提供C、C++、Fortran等多种语言的编译支持,为龙芯平台产生高效的目标代码.龙芯编译系统与龙芯目标机结合紧密,它...
刘颖黄磊胡士文吕方连瑞琦
关键词:龙芯处理器优化技术
文献传递
共3页<123>
聚类工具0