深圳大学计算机与软件学院广东省普及型高性能计算机重点实验室 作品数:13 被引量:34 H指数:3 相关作者: 罗小江 杨辉 吴晓峰 林毅锋 沈伟鹏 更多>> 相关机构: 佛山科学技术学院数学与大数据学院 南开大学化学学院 中国科学技术大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 深圳市基础研究计划项目 更多>> 相关领域: 自动化与计算机技术 理学 电子电信 更多>>
改进密度峰值支撑点选取及其在度量空间离群检测的应用 被引量:3 2017年 基于支撑点的度量空间离群检测算法旨在尽快提高离群度阀值,以达到快速检测离群点的效果.然而现有的相关算法缺乏有效的支撑点选取方法,造成支撑点选取结果不稳定,最终导致算法性能波动较大.应用于聚类的密度峰值算法不失为一种良好的支撑点选取算法,然而其密度峰值搜索目标难以确定.通过改进密度峰值算法,通过自动确定距离值,计算该范围内对象的数量来确定密度峰值,从而选取出具有最大密度的支撑点,应用于度量空间离群检测之中.实验结果表明该算法较已有算法获得较大的提升,平均加速比为2.41,最高达6.28;距离计算次数平均减少60.67%,最高达91.17%,而建立索引所需时间在可接受范围内. 许红龙 唐颂 毛睿 陈国良 刘刚关键词:离群检测 度量空间 索引 电表图像中多条码的定位与识别 被引量:1 2014年 根据条形码的平行、密集等特性,设计了一套在电表图像中对多条条形码进行定位并且逐一识别的算法,可用于抄录条码的人工智能设备.该算法主要分三部分,分别是条码定位、条码抽取和条码识别.其中条码定位和条码抽取的算法,是根据条形码的平行和紧密的形态特性而设计;而条码识别在条码抽取的基础上利用组合计算条和空的宽度比例.实验表明,本文算法能够对图像中多个条形码进行准确且快速的定位,并且能逐个识别和校验. 雷海军 林毅锋 罗小江 沈伟鹏关键词:边缘检测 霍夫变换 条码识别 基于近期最远遍历的支撑点选择 被引量:5 2017年 度量空间数据管理分析方法把数据抽象成度量空间中的点,具有高度的通用性,是应对大数据多样性挑战的有效手段之一.由于度量空间没有坐标,很多数学工具无法直接使用,一般以数据到参考点(也称作支撑点)的距离作为坐标.支撑点的好坏对于度量空间数据管理分析的性能发挥着关键性的影响.最远优先遍历(Farthest First Traversal,FFT)可以选出数据拐角的点,具有线性的时间复杂度和空间复杂度,是使用最广泛的支撑点选取算法之一.但是,实验表明最好的支撑点往往不是最拐角的点,故FFT很难选出最好的支撑点.提出近期最远遍历(Recent Farthest Traversal,RFT)算法,只以近期的几个支撑点来选择下一个支撑点,能够更快地选出性能更优的支撑点.同时,实验表明FFT还可以在数据内部均匀抽样.提出支撑点集合选择算法(Pivot Set Selection,PSS),可以一次性选出所有支撑点.以RFT选择候选集,以FFT选择评价集,选出支撑点并构建相似性索引,PSS使得索引构建代价大大降低,索引性能得到一定提升.实验表明,RFT选出好的支撑点的速度远快于FFT,准确率高于FFT,而FFT的抽样效果良好. 李兴亮 毛睿关键词:度量空间 多样性 大数据 高性能计算及其相关新兴技术 被引量:14 2015年 回顾高性能计算的发展历史,评述网格计算、云计算及其与高性能计算之间的关系,阐释新兴技术大数据和物联网,比较大数据、云计算与高性能计算的性能并分析其彼此间的关系.介绍代表国际高性能计算领域发展趋势的普适高性能计算以及作者在普及型高性能计算机研制方面的最新进展.指出高性能计算存在的一些难题,以及研制千万亿次以上的高性能计算机所面临的挑战. 陈国良 毛睿 蔡晔关键词:计算机工程 网格计算 云计算 大数据 物联网 多视点视频编码混合快速搜索算法 被引量:3 2013年 EPZS是联合多视点视频编码(JMVC,Joint Multi-view Video Coding)运动估计中采用的一种预测搜索算法,其搜索速度慢.针对EPZS算法的性能不足,我们在预测矢量集合、搜索模型、阈值设置和搜索策略四个方面进行改进,提出了一种混合快速搜索算法.在联合多视点视频编码测试平台JMVC8.3中,对三个由平行摄像机采集的多视点视频测试序列BallRoom、Exit和Vassar进行测试.实验结果表明:在保证视频重建质量和码率的前提下,与Jmvc中的EPZS算法相比,编码速度平均提高了55.66%~69.62%,改进算法的效果明显,编码效率得以提高. 雷海军 杨辉 杨张 袁梅冷关键词:多视点视频编码 混合搜索 一种机械式电表读数区域的自动定位方法 被引量:1 2017年 针对电表读数区域自动定位这一关键技术的具体应用,提出了一种适合四种类型机械式电表的读数区域自动定位算法;采用同态滤波增加图像前景与背景之间的亮度差异,同时利用改进的Bersen算法,有效的将电表前景与背景分开;利用区域定位对图像进行粗定位,并对粗定位区域纵向投影,根据目标字符的纹理特征和先验知识对目标区域精确定位;经实验证明,该算法对其中四种电表图像的适应性良好。 赵艳红 杨张 雷海军 赵雨佳关键词:同态滤波 粗定位 基于多种支撑点的度量空间离群检测算法 被引量:4 2017年 大数据的价值实现,归根到底还是依赖于数据挖掘技术.而在很多领域中,海量数据的非常规模式往往更具分析价值.离群检测,也叫异常检测,是用于挖掘海量数据中非常规模式的一项关键技术,广泛应用于网络入侵检测、公共卫生、医疗监控等领域.基于索引的离群检测算法通常具有较高的检测速度,然而现有的大多数基于索引的检测算法并非完全基于距离,导致通用性降低.较高的抽象能力使得度量空间具有比多维空间更广泛的适用范围,在其基础上设计的算法具有更高的通用性.而最新的度量空间基于索引的离群检测算法iORCA算法通过随机选取支撑点,基于数据到单支撑点的距离建立索引,并应用终止规则(Stopping rule)以期提前结束离群检测并得到正确的结果,多数情况下该机制起到加快检测速度的重要作用.然而iORCA算法未提供支撑点选取算法导致检测结果不稳定,且未能充分利用距离三角不等性减少距离计算次数.针对这些问题,文中指出基于距离的离群点定义应结合使用完全基于距离的离群检测算法,以确保算法的通用性,由此提出了度量空间离群检测的概念.在此基础上明确了支撑点选取的两大目标,即边缘支撑点和密集支撑点,并提出基于多种支撑点的度量空间离群检测算法VPOD.考虑到两个支撑点选取目标难以同时达到,VPOD算法分别予以选取,在近似的密集区域选取支撑点,即密集支撑点,对应使用终止规则,然后用FFT(Farthest-First Traversal)算法另选取若干支撑点,即边缘支撑点,与数据集计算距离而形成支撑点空间,利用距离三角不等性,使距离计算次数显著减少,从而提高检测速度.实验表明该算法能在可接受的时间范围内建立索引,并能高效检测离群点,加速比达2.05,最高达3.54,距离计算次数平均减少51.14%,最高达89.46%,同时保持对多种常见的基于距离的离群点定 许红龙 唐颂 毛睿 沈婧 刘刚 陈国良关键词:离群检测 度量空间 索引 多分支特征融合分类网络用于CXR图像识别 被引量:1 2025年 COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量时间和精力,而且增加医生感染的风险。因此,能够从胸部X射线的图像中,自动识别COVID-19的算法显得尤为重要。本文提出了一种基于深度学习的CXR图像分类框架,该框架能够在有限的训练数据下生成更具判别力的特征。具体而言,首先通过残差神经网络(ResNet34和ResNet50)和Transformer组成多分支分类网络,其中ResNet分支通过深度残差结构,有效地提取丰富的语义信息和细腻的纹理信息;而Transformer分支则通过自注意力机制,捕捉图像的全局语义特征。随后,利用特征交互模块将ResNet分支提取丰富的语义信息和纹理信息,与Transformer提取的全局语义特征进行特征交互。最后,再通过特征融合模块来提取图像的多尺度语义特征。该方法能够在有限训练数据的条件下提取多尺度特征表示,以对COVID-19感染区域进行特征提取和定位。实验在公开DLAI3和COVIDx数据集上与15种方法进行了比较,相比于ResNet50的模型,准确率分别提高了1.37%和0.76%。本文提出的分类方法,结合ResNet和Transformer网络在特征提取上的优点,使得网络对CXR图像的识别结果更加准确。 苏华强 雷海军 雷柏英关键词:TRANSFORMER 多视点视频编码模式决策快速算法 被引量:1 2015年 多层循环的多参考帧选择算法和运动估计搜索等算法提高了模式选择精度,但导致多视点视频编码复杂度急剧增加.我们在运动估计快速搜索算法的基础上,结合采用信息重用技术的多参考帧选择算法,提出一种模式决策快速算法.其中信息重用技术通过模式集合划分思想,根据模式尺寸块大小和编码特点将所有编码模式划分成三个集合,在同一集合中小尺寸块重用大尺寸块的最佳参考帧索引和最佳编码方向以减少多参考帧循环搜索次数.实验结果表明:与JMVC8.3.1原算法相比能减少70%-90%的编码复杂度,峰值信噪比(PSNR)下降在0.1d B以内,码率增加幅度少于6%. 袁梅冷 杨张 雷海军关键词:多视点视频编码 RPA:一种内存高效的度量空间recall@R近似最近邻搜索索引 2023年 现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多或者未能充分利用距离信息导致搜索时内存开销巨大.为此,提出精简排列阵(reduced permutation array, RPA)的度量空间recall@R近似最近邻搜索方法.对于全体数据元素,RPA预先选择k个支撑点,对每个数据元素仅存储离该数据元素最近的l个(l< 江润本 陈家颖 毛睿关键词:计算机科学与技术 度量空间 索引结构