李文明
- 作品数:102 被引量:41H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 一种基于RISC-V扩展指令的矩阵及向量运算装置
- 本发明实施例提供一种基于RISC‑V扩展指令的矩阵及向量运算装置,所述装置包括相互连接的协处理器与主处理器,主处理器中配置有RISC‑V指令集和协处理器扩展指令集,RISC‑V指令集包括与向量运算任务相关的向量扩展指令集...
- 张志远李文明范志华安学军叶笑春范东睿
- 一种ECDSA算法执行系统及方法
- 本发明提供一种ECDSA算法执行系统及方法,主机端通过数据流芯片进行加密和解密操作,通过网络传输加密信息。本发明相比于现有技术,通过将ECDSA算法移植到数据流架构芯片上,利用了数据流架构芯片低访存需求的特点,加快了EC...
- 范志华 秦宏 吴欣欣李文明安学军叶笑春范东睿
- NDP-Ledger:面向区块链应用的通用高通量加速架构
- 2020年
- 区块链技术由于去中心化及不可篡改等特性,广泛应用于数字货币、支付交易等领域,其算法对计算能力和存储访问能力有较高要求,导致传统冯诺依曼结构在面向区块链应用时能效比较低。3D堆叠存储器因可以缓解冯诺依曼结构的访存瓶颈,成为了热门研究方向之一。本文基于3D堆叠存储器技术及数据流执行模式,提出了一种面向区块链应用的高通量近数据处理(NDP)架构,NDP-Ledger。本文深入分析和论证了区块链应用的计算特征及3D堆叠存储技术在区块链应用中的适应性问题,并基于数据流执行模式设计了一种通用的高并发区块链加速体系结构,使区块链加速器在满足通用性的前提下提高处理性能。模拟评估结果表明,本文提出的区块链通用加速器结构,在典型区块链应用处理方面的性能优于主流的CPU和GPU。
- 安述倩李文明李文明范志华吴萌王达张浩王达
- 关键词:区块链数据流
- 一种异常事件自动推送及基于历史操作的监控方法及系统
- 本发明提出一种异常事件自动推送及基于历史操作的监控方法及系统,涉及监控室内视频墙智能显示领域,该方法包括获取多路视频流,对所述多路视频流进行编解码操作,生成与每路所述视频流相对应的图像帧,通过识别算法对所述图像帧进行异常...
- 李文明叶笑春孙凝晖范东睿王达马丽娜朱亚涛张洋
- 面向数据流结构的指令内访存冲突优化研究被引量:1
- 2019年
- 神经网络等人工智能应用的迅速兴起给传统处理器的设计带来了巨大的挑战,粗粒度数据流架构因具有高指令并发和高通用性的特点成为研究热点.然而,由于粗粒度数据流结构处理单元采用随机访问存储器作为存储结构,加之神经网络中大部分运算数据具有密集型特点,造成大量的指令内操作数访存冲突.通过分析典型神经网络的访存行为,发现此类应用存在指令内操作数冲突,会引起计算部件利用率的降低.基于此分析,提出了灵活的数据冗余策略.在编译指令阶段,为指令内有访存冲突的操作数申请数据冗余空间,降低指令内操作数访存延迟.实验以典型的神经网络LeNet,AlexNet为基准测试程序.采用灵活的数据冗余策略之后,能耗比相对于Round-Robin和ReHash的无数据冗余策略分别提高了30.21%和12.37%,相比于2套全数据冗余策略能耗比提高了27.95%.
- 欧焱冯煜晶李文明叶笑春王达范东睿
- 关键词:数据冗余能耗比
- 一种哈希硬件处理装置及方法
- 本发明提供一种基于阻变存储器的哈希硬件处理装置及方法,所有的源数据无需送往CPU进行哈希函数的计算,在RRAM中根据电流叠加效应即可完成哈希函数输入数据的操作,并在存储器中实现哈希表的建立,无需将大量的源数据送往CPU后...
- 李文明叶笑春安述倩姜志颖王晨晖范东睿
- 高密度片上网络的路网实现方法及装置
- 本发明提供了一种高密度片上网络的路网实现方法,适用于众核片上网络技术领域,包括:步骤1,将第一路由和第二路由的链路划分为多个低宽度的自治的子链路;步骤2,检测输入端口的数据包的队列,配置所述子链路和所述队列在同一时刻并行...
- 李文明孙凝晖谢向辉李宏亮郑方
- 一种基于混合积的任务处理方法及计算装置
- 本发明提供了一种基于混合积的任务处理方法及计算装置,该方法包括:获取计算任务所需的第一矩阵A、第二矩阵B和第三矩阵C,计算任务是求AB+C的结果矩阵D的矩阵乘加运算;获取硬件规模t;根据硬件规模和预设的划分规则,将A、B...
- 张志远范志华李文明邱宇航安学军叶笑春范东睿
- 基于粗粒度数据流架构的稀疏卷积神经网络加速被引量:10
- 2021年
- 卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).
- 吴欣欣欧焱李文明王达张浩范东睿
- 基于数据流架构的Cholesky分解加速计算方法及其系统
- 本申请公开了一种基于数据流架构的Cholesky分解加速计算方法,所述方法包括:数据准备步骤、矩阵2×2分块计算步骤及矩阵1×1分块计算步骤;将数据流架构中处理单元PE阵列分为多个PE组,将不规则的待计算矩阵按照预定划分...
- 王珎范志华刘天雨李文明叶笑春范东睿