您的位置: 专家智库 > >

王肇康

作品数:13 被引量:17H指数:2
供职机构:南京大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 10篇专利
  • 2篇期刊文章
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 2篇理学

主题

  • 5篇编程
  • 3篇用户
  • 3篇子图
  • 3篇分布式
  • 2篇倒排索引
  • 2篇调度
  • 2篇调度器
  • 2篇应用程序
  • 2篇应用程序接口
  • 2篇用户程序
  • 2篇预处理
  • 2篇智能化
  • 2篇智能化调度
  • 2篇数据处理
  • 2篇数据处理程序
  • 2篇数据集
  • 2篇数据预处理
  • 2篇索引
  • 2篇图生成
  • 2篇资源管理

机构

  • 13篇南京大学
  • 1篇南京航空航天...

作者

  • 13篇王肇康
  • 12篇黄宜华
  • 10篇顾荣
  • 3篇袁春风
  • 2篇王申
  • 1篇戴海鹏

传媒

  • 1篇电子学报
  • 1篇实验技术与管...

年份

  • 1篇2024
  • 2篇2023
  • 4篇2021
  • 1篇2020
  • 2篇2019
  • 1篇2018
  • 1篇2017
  • 1篇2016
13 条 记 录,以下是 1-10
排序方式:
一种阈值自适应的集合相似连接方法
本发明公开了一种阈值自适应的集合相似连接方法,对于保存在数据库中的由集合记录构成的数据集R和S,以及相似度阈值τ,共包含六个步骤,其中前两个步骤属于数据预处理阶段,后四个步骤属于相似连接阶段:第一步,对R和S中所有的集合...
顾荣黄宜华王肇康王申
文献传递
跨语言用户态文件系统框架读写性能优化
2023年
以深度学习为代表的数据分析应用越来越多依赖分布式文件系统存储管理大规模数据集.为了增强数据访问的兼容性,现有分布式文件存储系统通常需提供标准POSIX接口,以支持深度学习等应用的无缝对接.然而,以内核模块形态开发提供POSIX接口的文件系统非常复杂耗时.近年来,用户态文件系统(Filesystem in Userspace,FUSE)框架大幅简化了文件系统的开发工作,已被Alluxio和Ceph等诸多知名分布式文件系统使用.目前常用的用户态FUSE库libfuse仅提供C语言编程接口,但现有大数据分布式文件系统基本都是基于Java语言开发的(例如HDFS和Alluxio等),为了使基于Java语言开发的分布式文件系统可以对接C语言开发的FUSE库,需采用跨语言FUSE框架作为中介.跨语言FUSE框架利用跨编程语言的函数回调机制,使操作系统FUSE库的C语言函数可以跨语言的调用分布式文件系统提供的Java语言编程接口,从而为大数据分布式文件系统提供标准POSIX接口的访问能力.但在数据密集型应用中,现有跨语言FUSE框架的执行效率低,导致数据密集型作业(深度学习、大数据分析等)中数据I/O耗时占据了显著的性能开销,成为新的潜在性能瓶颈.针对此问题,本文首先评估分析了重要且广为使用的跨语言FUSE框架JNR-FUSE的性能,发现并定位其在高并发和小文件场景下存在的性能瓶颈;接着从多方面剖析性能瓶颈根因,进而总结出高效跨语言FUSE框架的性能优化方向,并面向Java语言设计实现了跨语言FUSE框架JNI-FUSE.JNI-FUSE利用延迟分离和元信息缓存等优化技术降低跨语言函数回调开销,从而提升跨语言FUSE框架的性能.实验结果表明,对比当前性能最好的Java FUSE框架JNR-FUSE,本文提出的JNI-FUSE带来了1.15~6.04倍的FUSE框架性能提升和1.90~2.71倍的文件系统端到端性能提升,并为上层深度学习训练任务带来了1.06~1.73倍的训练加速.本文设�
顾荣罗义力仇伶玮王肇康戴海鹏戴海鹏
关键词:POSIX跨语言
大数据在线实训平台及综合实验课程体系设计被引量:15
2021年
针对“大数据处理综合实验”课程教学中学生接触集群难、编程难度高、学习效率低等问题,设计实现了大数据在线教学实训平台。该平台集成了大数据存储、计算、查询、可交互式编程等模块,实现了包括并行编程实训、学生管理、资源调度、教学过程监控等功能的一体化大数据教学系统。基于该平台,还设计了一系列由浅入深的大数据分析案例和编程实验项目。教学实践表明,该平台在帮助学生直观理解并行处理技术和分布式系统、培养学生大数据应用并行处理编程能力等方面起到了很好的作用。
顾荣殷瀚王肇康黄宜华袁春风
关键词:实训平台实验教学
一种分布式的子图枚举方法
本发明公开了一种分布式的子图枚举方法,包括以下步骤:第一步,根据输入的查询图生成一棵查询树,并将查询树分发到各个计算节点;第二步,根据查询树在输入的数据图上查询出部分匹配结果;第三步,根据部分匹配结果和查询树,完成子图匹...
顾荣黄宜华王肇康冯轩
一种跨平台统一的分布式图数据处理方法
本发明公开了一种跨平台统一的分布式图数据处理方法,包括如下步骤:用户通过跨平台统一分布式图处理编程框架提供的API触发计算;用户的程序被序列化到程序文件中并上传分布式文件系统;框架启动相应分布式图处理系统的计算作业;集群...
黄宜华王肇康黎俊虹
文献传递
面向深度学习的GPU资源管理与智能化调度方法
本发明公开了一种面向深度学习的GPU资源管理与智能化调度方法,包括以下步骤:第一步,用户通过前端接口组件提交深度学习作业,包括待执行的深度学习程序与训练数据集;第二步,在进行验证后将作业添加到调度器对应的待调度队列;第三...
顾荣刘率王肇康袁春风黄宜华
在交互式R语言平台中进行并行线性代数计算的方法
本发明公开了一种基于交互式R语言平台的并行化线性代数计算的方法,包括以下步骤:提供两个计算平台,一个是交互式R语言平台,另外一个是并行线性代数计算平台,两个计算平台通过计算机网络进行通信;然后在交互式R语言平台中,设计实...
顾荣王肇康黄宜华樊士庆
文献传递
在交互式R语言平台中进行并行线性代数计算的方法
本发明公开了一种基于交互式R语言平台的并行化线性代数计算的方法,包括以下步骤:提供两个计算平台,一个是交互式R语言平台,另外一个是并行线性代数计算平台,两个计算平台通过计算机网络进行通信;然后在交互式R语言平台中,设计实...
黄宜华王肇康顾荣樊士庆
一种阈值自适应的集合相似连接方法
本发明公开了一种阈值自适应的集合相似连接方法,对于保存在数据库中的由集合记录构成的数据集R和S,以及相似度阈值τ,共包含六个步骤,其中前两个步骤属于数据预处理阶段,后四个步骤属于相似连接阶段:第一步,对R和S中所有的集合...
顾荣黄宜华王肇康王申
文献传递
分布式图处理若干算法与统一图处理编程框架研究
现实世界中的许多数据,例如社交网络、生物信息网络等,都可以采用离散数学中的图结构进行建模。随着信息技术的飞速发展,图数据的规模急速增长,用户对图数据分析的性能要求也日益增长,采用分布式计算技术处理大规模图数据变得势在必行...
王肇康
关键词:编程模型
共2页<12>
聚类工具0