张扬扬
- 作品数:14 被引量:2H指数:1
- 供职机构:北京航空航天大学更多>>
- 发文基金:国家重点实验室开放基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 虚拟机连续快照方法和装置
- 本发明提供一种虚拟机连续快照方法和装置,虚拟机连续快照方法包括:将虚拟机停机;根据虚拟机中各页面的第一位图信息的值更新各页面的第二位图信息的值;初始化虚拟机中各页面的第一位图信息的值;恢复虚拟机的运行;依次判断虚拟机中各...
- 李建欣郑京生崔磊沃天宇张扬扬
- 一种确保分布式学习系统的高可用性方法
- 本发明通过深度学习领域的方法,实现了一种确保分布式学习系统的高可用性方法。利用计算节点上已经存在的参数的副本进行容错,并通过主动复制将每个参数补全到多个副本。具体分为两个阶段,无故障训练阶段和故障恢复阶段,无故障训练阶段...
- 李建欣张扬扬刘阳张帅周号益
- 分布式图数据处理方法和装置
- 本发明提供一种分布式图数据处理方法和装置。本发明提供的分布式图数据处理方法,包括:在第一从计算节点执行完本轮迭代处理,并且判断消息队列中不存在待处理的第二计算消息、以及判断当前处理的分块中不存在活跃顶点时,在等待接收目标...
- 李建欣曹英杰李博张扬扬
- 机器学习方法和从节点
- 本发明提供一种机器学习方法和从节点。本发明提供的机器学习方法,应用于机器学习系统,所述机器学习系统包括分布式共享内存的参数服务器、主节点和多个从节点;所述参数服务器用于存储全局模型参数和全局训练数据;所述主节点用于根据全...
- 胡春明孙承根张扬扬怀进鹏李建欣
- 压缩文件的修改方法与装置
- 本发明提供一种压缩文件的修改方法与装置。该方法包括:接收用户输入的修改指令,修改指令包括待修改字符和修改字符,修改指令用于将压缩文件中的待修改字符更新为修改字符;解析压缩文件,获得压缩文件的码表和压缩文件的二进制码流;其...
- 李建欣何川彭浩张扬扬
- 文献传递
- 基于多传感器数据融合的机器人导航方法及装置
- 本发明提供了一种基于多传感器数据融合的机器人导航方法及装置,包括:根据激光雷达传感器采集到的数据和编码器数据,构建总体环境地图;实时根据激光雷达传感器、加速度计传感器、陀螺仪传感器和磁强计传感器采集的数据、总体环境地图、...
- 李建欣王皓悦张扬扬张日崇怀进鹏
- 文献传递
- 一种流式处理系统的轻量级容错方法
- 本发明通过网络技术领域的方法,实现了一种流式处理系统的轻量级容错方法。分为无故障运行阶段和故障恢复阶段;无故障运行阶段将流式处理系统中的有状态任务组织成多条链式结构,以多个任务连成一条链,链上的每一个任务都周期性地采用链...
- 李建欣张扬扬刘阳张帅周号益
- 虚拟机连续快照方法和装置
- 本发明提供一种虚拟机连续快照方法和装置,虚拟机连续快照方法包括:将虚拟机停机;根据虚拟机中各页面的第一位图信息的值更新各页面的第二位图信息的值;初始化虚拟机中各页面的第一位图信息的值;恢复虚拟机的运行;依次判断虚拟机中各...
- 李建欣郑京生崔磊沃天宇张扬扬
- 文献传递
- 一种确保分布式学习系统的高可用性方法
- 本发明通过深度学习领域的方法,实现了一种确保分布式学习系统的高可用性方法。利用计算节点上已经存在的参数的副本进行容错,并通过主动复制将每个参数补全到多个副本。具体分为两个阶段,无故障训练阶段和故障恢复阶段,无故障训练阶段...
- 李建欣张扬扬刘阳张帅周号益
- 文献传递
- 面向流式数据处理系统的高效故障恢复方法被引量:2
- 2022年
- 针对流式数据处理系统Flink无法高效处理单点故障的问题,提出了一种基于增量状态和备份的故障容错系统Flink+。首先,提前建立备份算子和数据通路;然后,对数据流图中的输出数据进行缓存,必要时使用磁盘;其次,在系统快照时进行任务状态同步;最后,在系统故障时使用备份任务和缓存的数据恢复计算。在系统实验测试中,Flink+在无故障运行时没有显著增加额外容错开销;而在单机和分布式环境下处理单点故障时,与Flink系统相比,所提系统在单机8任务并行度下故障恢复时间减少了96.98%,在分布式16任务并行度下故障恢复时间减少了88.75%。实验结果表明,增量状态和备份方法一起使用可以有效减少流式系统单点故障的恢复时间,增强系统的鲁棒性。
- 刘阳张扬扬张扬扬
- 关键词:故障恢复