您的位置: 专家智库 > >

毛梦捷

作品数:14 被引量:1H指数:1
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇专利
  • 3篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 9篇自动化与计算...

主题

  • 6篇多核
  • 6篇处理器
  • 4篇多核处理
  • 4篇多核处理器
  • 4篇线程
  • 3篇动态可重构
  • 3篇可重构
  • 3篇TRIPS
  • 2篇调度
  • 2篇原语
  • 2篇值传递
  • 2篇任务调度
  • 2篇统一接口
  • 2篇吞吐
  • 2篇资源分配
  • 2篇资源模型
  • 2篇系统软件
  • 2篇粒度
  • 2篇逻辑处理器
  • 2篇接口

机构

  • 14篇中国科学技术...
  • 1篇北京神舟航天...

作者

  • 14篇毛梦捷
  • 13篇安虹
  • 8篇孙涛
  • 5篇任永青
  • 4篇李颀
  • 4篇邓春华
  • 3篇张海博
  • 3篇邓博斌
  • 2篇王涛
  • 2篇魏学超
  • 2篇孙公瑾
  • 2篇许牧
  • 2篇刘杨
  • 2篇刘扬
  • 2篇刘扬
  • 2篇李功明
  • 1篇王涛
  • 1篇刘玉

传媒

  • 1篇计算机工程
  • 1篇小型微型计算...
  • 1篇中国科学院研...
  • 1篇2012中国...

年份

  • 1篇2015
  • 1篇2014
  • 4篇2013
  • 5篇2012
  • 2篇2011
  • 1篇2010
14 条 记 录,以下是 1-10
排序方式:
EDGE结构上一种通过超块重组加速单线程应用的方法
Explicit Data Graph Execution( EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构。相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock...
魏学超安虹毛梦捷
关键词:EDGETRIPS
文献传递
程序局部性的量化分析被引量:1
2013年
给出与平台无关的局部性量化方法,从空间局部性和时间局部性2个角度,量化SPEC2000测试基准程序,以及这些程序的数据段、代码段和堆栈段。时间和空间局部性组成的二维局部性分布直观地展示了基准测试程序的局部性。实验结果表明,程序数据局部性主要由堆段的局部性决定,堆段的局部性最差,栈的局部性最优。
刘扬安虹邓博斌毛梦捷刘玉
关键词:缓存
串行程序线程级推测执行能力评估方法和评估器
本申请公开了串行程序线程级推测执行能力评估方法和评估器,所述方法包括:通过记录串行程序一个执行阶段在执行过程中包括的正确推测的线程的数目,得到该执行阶段的线程推测深度值;确定所述线程推测深度值作为所述执行阶段后续重复执行...
安虹任永青孙涛邓春华毛梦捷刘扬
串行程序线程级推测执行能力评估方法和评估器
本申请公开了串行程序线程级推测执行能力评估方法和评估器,所述方法包括:通过记录串行程序一个执行阶段在执行过程中包括的正确推测的线程的数目,得到该执行阶段的线程推测深度值;确定所述线程推测深度值作为所述执行阶段后续重复执行...
安虹任永青孙涛邓春华毛梦捷刘扬
文献传递
TRIPS上的矩阵乘法性能分析
以TRIPS为代表的分片式结构是未来通用微处理器设计的可选方案之一.TRIPS采用细粒度推测多线程的方法,极大地开发了程序运行时的片内并行性,力图为各种类型的应用提供一个统一高效的实现平台.但运行稠密数值运算时,由于数据...
毛梦捷安虹刘扬孙涛
关键词:系统结构
一种应用于线程级推测并行的限制性值传递方法和装置
本发明提出了一种应用于线程级推测并行的限制性值传递方法和装置,在冲突发生时可以通过值传递的方法来减少系统的总执行时间。也就是说只有在满足特定的条件,冲突线程才可能会受到需要的数据,否则就只会按原始系统的方式执行。这是一种...
安虹邓博斌李颀李功明毛梦捷
文献传递
一种在FCMP上支持系统级资源分配和任务调度的方法及装置
本发明公开了一种在FCMP上支持系统级资源分配和任务调度的方法及装置,包括:向上层软件提供一组具有统一接口的原语;调用返回暂停原语,暂停FCMP上当前运行逻辑核,向上层软件返回逻辑核的标识号和粒度;调用与任务调度相关的原...
安虹孙涛任永青毛梦捷刘杨李颀邓春华许牧
EDGE结构上一种通过超块重组加速单线程应用的方法
2012年
Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行,超块之间按照推测序保持控制流执行,有利于挖掘指令级并行性.但是,EDGE编译器按照程序的串行执行顺序组织超块,超块间和超块内部受限于数据依赖,削弱了整个程序运行时的潜在数据级并行性和线程级并行性,不利于发挥EDGE分片式结构的优势.本文通过分析EDGE编译器超块组织的特点,结合EDGE结构特有的执行模型,提出一种普适性的超块组织框架来模拟EDGE结构上多线程运行的效果,进一步挖掘EDGE结构运行串行单线程程序时的指令级并行性.本文选用TRIPS微处理器作为EDGE结构的实例处理器,利用矩阵乘法等三个实验验证了我们所提出的框架的可行性,实验结果表明这些应用在TRIPS上获得了较好的性能提升.
魏学超安虹毛梦捷
关键词:EDGETRIPS
一种应用于线程级推测并行的限制性值传递方法和装置
本发明提出了一种应用于线程级推测并行的限制性值传递方法和装置,在冲突发生时可以通过值传递的方法来减少系统的总执行时间。也就是说只有在满足特定的条件,冲突线程才可能会受到需要的数据,否则就只会按原始系统的方式执行。这是一种...
安虹邓博斌李颀李功明毛梦捷
文献传递
分布式动态可重构多核处理器上的取指停顿容忍技术
近年来,随着片上多处理器(CMP)成为各种芯片设计的主流结构,如何提高串行程序的性能已成为迫待解决的问题。一些研究者提出了采用分布式动态可重构多核处理器(Distributed Dynamic Reconfigurabl...
毛梦捷
文献传递
共2页<12>
聚类工具0