张孝慈
- 作品数:11 被引量:19H指数:3
- 供职机构:中国科学技术大学更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于图像处理的轮胎X光图像缺陷检测方法
- 本发明公开了一种基于图像处理的轮胎X光图像缺陷检测方法,是利用边缘分析的图像分割算法,并结合基于列的自适应阈值二值化算法对轮胎稀线缺陷进行自适应特征提取,然后采用非极大值抑制的方法对特征向量进行阈值判定以完成缺陷检测。本...
- 顾乃杰张宇翔张孝慈
- 一种基于轻量级循环单元LRU的文本预测方法
- 本发明公开了一种基于轻量级循环单元LRU的文本预测方法,其步骤包括:1对文本语料库进行预处理,生成单词序列,并将每个单词转换为独热编码向量格式;2构造轻量级循环单元,得到能够对单词序列进行语义描述的特征模型;3对轻量级循...
- 顾乃杰张孝慈张宇翔宁卓睿
- 一种基于HXDSP的移位器查找表技术被引量:1
- 2019年
- 高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。
- 叶鸿顾乃杰林传文张孝慈陈瑞
- 关键词:移位器
- 一种基于图像处理的轮胎X光图像缺陷检测方法
- 本发明公开了一种基于图像处理的轮胎X光图像缺陷检测方法,是利用边缘分析的图像分割算法,并结合基于列的自适应阈值二值化算法对轮胎稀线缺陷进行自适应特征提取,然后采用非极大值抑制的方法对特征向量进行阈值判定以完成缺陷检测。本...
- 顾乃杰张宇翔张孝慈
- 文献传递
- 一种基于龙芯3B的自适应矩阵乘法优化方法
- 本发明公开了一种基于龙芯3B的自适应矩阵乘法优化方法,先将龙芯3B的乘法矩阵和被乘矩阵按分块大小不大于二级缓存的原则划分成为两个子矩阵,利用龙芯3B芯片上的直接高速缓冲存储器存取器预取列长为M宽为K的乘法矩阵到高速缓冲区...
- 顾乃杰赵增张孝慈张明
- 文献传递
- 递归神经网络模型的若干关键问题研究
- 大数据时代的到来促进了数据分析方法的创新,基于神经网络的深度学习技术在多个领域取得了突破性的进展。递归神经网络(RNN)在处理连续时间序列的问题中起到了主导地位,被广泛应用于自然语言处理、计算机视觉、语音识别等多个研究领...
- 张孝慈
- 关键词:递归神经网络时间序列并行计算
- 一种基于龙芯3B的自适应矩阵乘法优化方法
- 本发明公开了一种基于龙芯3B的自适应矩阵乘法优化方法,先将龙芯3B的乘法矩阵和被乘矩阵按分块大小不大于二级缓存的原则划分成为两个子矩阵,利用龙芯3B芯片上的直接高速缓冲存储器存取器预取列长为M宽为K的乘法矩阵到高速缓冲区...
- 顾乃杰赵增张孝慈张明
- 文献传递
- 多GPU环境下的卷积神经网络并行算法被引量:5
- 2017年
- 随着深度学习的不断发展,卷积神经网络凭借其优异的识别性能,在图像识别、语音识别等领域受到了越来越多的关注.卷积神经网络的研究需要进行充分的实验,然而其训练过程通常需要大量时间.使用高性能GPU可以加速卷积神经网络的训练过程,但是由于GPU的特殊结构,进行多GPU的扩展时难以取得令人满意的加速比.提出一种在多GPU下的数据并行算法,与传统的客户机/服务器结构不同,该算法以环形结构组织GPU,更有利于多GPU扩展,系统不会受限于服务器节点的性能.此外还通过并行化单个GPU的计算与传输任务,提高GPU的使用效率.实验结果表明,使用4个GPU时,该算法分别在mnist和cifar10数据集上取得了3.77和3.79倍的加速比,并且对网络的识别性能无显著影响.
- 王裕民顾乃杰张孝慈
- 关键词:卷积神经网络GPU
- 基于卷积神经网络的图像验证码识别被引量:5
- 2018年
- 验证码作为一种安全手段,被广泛应用于互联网领域.本文提出了一种基于卷积神经网络的图像验证码识别方法,通过卷积层级联、残差学习、全局池化、分组卷积等技术手段,在保证识别准确率不受影响的前提下,大大降低了网络的参数量.本文以铁路购票网站验证码和正方教务系统验证码为例来测试模型性能.对于铁路购票网站验证码,实验结果显示本文提出的识别方法参数量最少,对图形和中文词组验证码的识别准确率分别达到98.76%和99.14%;对于正方教务系统验证码,本文方法参数量最少且识别准确率为87.30%.
- 秦波顾乃杰张孝慈张孝慈
- 关键词:卷积神经网络可视化
- 一种基于轻量级循环单元LRU的文本预测方法
- 本发明公开了一种基于轻量级循环单元LRU的文本预测方法,其步骤包括:1对文本语料库进行预处理,生成单词序列,并将每个单词转换为独热编码向量格式;2构造轻量级循环单元,得到能够对单词序列进行语义描述的特征模型;3对轻量级循...
- 顾乃杰张孝慈张宇翔宁卓睿
- 文献传递