杨雪冰
- 作品数:13 被引量:18H指数:3
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金湖南省科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学农业科学理学更多>>
- 气象大数据超短临精准降水机器学习与典型应用被引量:8
- 2019年
- 超短临精准的降水估计对农业生产、水文监测、洪涝减灾、大型活动、电力系统等方面具有重要意义。由于天气系统具有高度不确定性,传统基于物理模型和统计分析的气象方法在降水估计中难以满足高分辨率条件下的精度要求,如何提升超短临降水估计的精准性在研究和应用领域是极具挑战性的问题。本文提出了基于地形的加权随机森林(terrain-based weighted random forests, TWRF)方法用于雷达定量降水估计(quantitative precipitation estimation, QPE)。该方法可视为随机森林方法的推广,并在此基础上考虑了反射率垂直廓线(vertical profile of reflectivity, VPR)的特征重要性变化以及复杂地形区域降水的山岳抬升效应。对TWRF在中国杭州湾地区Z9571雷达45~100km覆盖范围内2014年6月份和7月份的降水过程上进行了实验验证,结果表明TWRF方法优于传统气象方法及随机森林方法,并表明利用整个VPR与基于地形的建模可以有效提升雷达QPE效果。
- 张晨阳杨雪冰张文生
- 关键词:天气雷达
- 基于Dropout深度网络的两步图像标注算法被引量:3
- 2015年
- 基于文本的图像检索技术强烈依赖于图像标签,深度学习可以用来实现图像标签的自动生成。多分类器融合是一种有效提升分类器精度的方法。为了提升深度学习模型的泛化性能,提出了Dropout算法。该方法的本质是在训练过程中随机地丢弃若干神经元,等价于同时训练多个子网络。由于图像标签的多样性,提出了两步标签融合算法:第一步,根据多个不同网络的输出将图像标签词汇分为基准词汇、备选词汇和无关词汇;第二步,选出备选词汇中与基准词汇强相关的词汇,基准词汇和被选出的词汇可作为图像的标签。最后,算法选取3个常用的数据集对提出的算法模型进行验证,实验结果表明,多分类器融合算法可以有效地解决图像自动标注问题。
- 杨阳张文生杨雪冰
- 关键词:图像自动标注
- 基于最优传输匹配的自监督投影几何矫正方法及装置
- 本发明提供一种基于最优传输匹配的自监督投影几何矫正方法及装置,该方法包括:获取投影仪在真实场景下的激光点阵相平面数据和相机相平面数据;基于匹配网络对激光点阵相平面数据和相机相平面数据进行匹配推断,得到匹配关系矩阵;其中,...
- 王波杨雪冰张文生
- 基于稀疏表示的SAR图像目标标记方法、系统、装置
- 本发明属于海洋舰船、机场飞机和阵地汽车安防遥感检测领域,具体涉及一种基于稀疏表示的SAR图像目标标记方法、系统、装置,旨在解决现有SAR图像目标检测及标记效率、准确率低的问题。本系统方法包括获取SAR图像,对图像阈值分割...
- 张文生杨阳黄妍杨雪冰
- 文献传递
- 一种时空数据预测方法、电子设备以及存储介质
- 本发明提供了一种时空数据预测方法、电子设备以及存储介质,可以应用于航迹预测领域。该方法包括:将飞行空间和飞行时间序列分别进行网格化处理以及标记编码;基于标记编码后的飞行三维空间网格和标记编码后的飞行时间网格构建多维度关系...
- 韩刚杨雪冰张文生
- 基于时空正则化流的动态链路预测
- 2024年
- 动态图作为图的一个重要分支,对节点间关系的动态变化过程具有良好的表达能力.利用动态图对实际关系网络进行建模,并动态预测未来时刻节点间的链路关系成为当前研究热点.然而,由于弱关系现象的存在,加权网络中的动态链路预测面临着重大挑战.针对这一问题,本文提出了一种基于正则化流的方法DynWFlow(dynamic weight flow).该方法能够从生成角度出发,自适应地评价节点间链路信息的重要性,从而精准地进行链路特征的抽取,有效地解决了动态链路预测问题.特别地,对于弱关系情况,提出利用邻居节点集权重的相似程度来评估不同链接关系的重要程度,实现对节点间隐含关系的进一步捕获.在多个领域大量真实数据的实验结果表明,所提出的基于正则化流的动态链路预测方法DynWFlow的性能明显优于其他预测算法.
- 尹彦婷吴雅婧杨雪冰张文生袁晓洁
- 关键词:动态图图嵌入
- 多模态医疗数据中海量小文件存储优化方法被引量:3
- 2023年
- Hadoop分布式文件系统(HDFS)通常用于大文件的存储和管理,当进行海量小文件的存储和计算时,会消耗大量的NameNode内存和访问时间,成为制约HDFS性能的一个重要因素.针对多模态医疗数据中海量小文件问题,提出一种基于双层哈希编码和HBase的海量小文件存储优化方法.在小文件合并时,使用可扩展哈希函数构建索引文件存储桶,使索引文件可以根据需要进行动态扩展,实现文件追加功能.在每个存储桶中,使用MWHC哈希函数存储每个文件索引信息在索引文件中的位置,当访问文件时,无须读取所有文件的索引信息,只需读取相应存储桶中的索引信息即可,从而能够在O(1)的时间复杂度内读取文件,提高文件查找效率.为了满足多模态医疗数据的存储需求,使用HBase存储文件索引信息,并设置标识列用于标识不同模态的医疗数据,便于对不同模态数据的存储管理,并提高文件的读取速度.为了进一步优化存储性能,建立了基于LRU的元数据预取机制,并采用LZ4压缩算法对合并文件进行压缩存储.通过对比文件存取性能、NameNode内存使用率,实验结果表明,所提出的算法与原始HDFS、HAR、MapFile、TypeStorage以及HPF小文件合并方法相比,文件读取时间更短,能够提高HDFS在处理多模态医疗数据中海量小文件时的整体性能.
- 曾梦邹北骥张文生杨雪冰朱承璋
- 关键词:HDFSHBASE
- 多源数据融合高时空分辨率晴雨分类被引量:3
- 2017年
- 高时空分辨率晴雨分类与交通、旅游、农业灌溉及人们日常出行都密切相关,然而"天有不测风云","东边日头西边雨",准确的高时空分辨率晴雨分类是极具挑战性的问题.提出了一种基于多源数据的多视角学习晴雨分类方法,其中,多源数据包括雷达、卫星及地面观测因子及晴雨观测数据.该方法表述如下:首先,依据雷达观测因子构造了Vis CAPPI视角和Vis PPI视角,依据葵花卫星资料构造了Vis Sat视角,依据地面观测因子构造了Vis Ground视角;然后,对这4个视角特征进行组合获得组合视角Vis CAPPI_PPI,Vis Radar_Sat,Vis Radar_Groumd,Vis Sat_Ground,Vis Radar_Sat_Ground,应用随机森林机器学习方法分别对这些视角进行样本学习,获得这些视角的晴雨分类模型;最后,对这些视角晴雨分类模型估计进行融合,获得晴雨分类结果.主要贡献在于:(1)提出了雷达、卫星和地面观测因子多视角构建方法,构建了Vis CAPPI,Vis PPI,Vis Sat和Vis Ground晴雨分类视角及其组合视角;(2)提出了一种多视角方法(multi-view weight random forest,简称MVWRF),能够处理雷达、卫星和地面观测因子多源数据融合晴雨分类问题,提高1km×1km和6min时空分辨率晴雨分类准确率.在2016年10月7日和8日,泉州雷达覆盖的393个气象观测站上进行模型训练和测试,结果显示,该方法能够取得较高的晴雨分类准确率和较低的漏报率、空报率,优于对比方法.
- 匡秋明杨雪冰张文生张文生惠建忠
- 关键词:多源数据
- 基于稀疏表示的SAR图像目标标记方法、系统、装置
- 本发明属于海洋舰船、机场飞机和阵地汽车安防遥感检测领域,具体涉及一种基于稀疏表示的SAR图像目标标记方法、系统、装置,旨在解决现有SAR图像目标检测及标记效率、准确率低的问题。本系统方法包括获取SAR图像,对图像阈值分割...
- 张文生杨阳黄妍杨雪冰
- 文献传递
- 医疗器械位姿估计模型的训练方法、位姿估计方法及装置
- 本发明提供一种医疗器械位姿估计模型的训练方法、位姿估计方法及装置,该医疗器械位姿估计模型的训练方法包括:从虚拟医疗器械的姿态采样空间中的多个采样点分别获取多个样本图像;分别提取出每个样本图像对应的轮廓掩码图,并根据轮廓掩...
- 王波胡占义杨雪冰张文生