公共文化服务平台

分布式与自动化大数据智能分析算法与编程计算平台: 与传统小规模数据场景下的智能化分析应用不同,大数据场景下的智能化分析应用,不再是单一的单机AI算法模型问题,而是大数据、大模型、大计算的融合,需要同时考虑算法模型设计、大数据处理以及高效的分布并行计算问题,这对大数据智能...; 朱光辉

试论公司的社会责任被引量：1: 2012年; 随着经济全球化的发展,在全球范围内进行资源配置的公司越来越多,公司对社会的影响力也越来越大,公司的社会责任问题随之也越来越受到人们的关注和重视。但作为一个经济后发国家,直到20世纪末期,我国公司的社会责任问题才受到人们的高度重视。我国《公司法》第5条明确规定:"公司从事经营活动,必须遵守法律、行政法规,遵守社会公德、商业道德,诚实守信,接受政府和社会公众的监督,承担社会责任。"因此,在现阶段研究公司的社会责任问题,不仅具有重要的理论意义,而且具有巨大的社会现实意义。; 朱光辉; 关键词：公司社会责任

一种机器学习流水线自动化设计的方法: 本发明公开了一种机器学习流水线自动化设计方法，将机器学习流水线的构建过程分为两部分：结构搜索和超参调优，将结构搜索过程建模为强化学习问题，使用强化学习算法学习搜索策略；在确定了机器学习流水线的超参数后，再使用贝叶斯优化对...; 朱光辉黄宜华方鑫

渐进式深度集成架构搜索算法研究: 2023年; 深度神经网络已在各个领域取得巨大成功.然而,深度学习模型并不只包含深度神经网络.近年来,以深度森林为代表的深度集成学习模型,凭借着无需反向传播训练、计算开销更小、模型复杂度支持自适应确定以及表数据建模任务性能优异等特点,引起了学界和业界的广泛关注,并且取得了良好的应用效果.深度森林为探索DNN(Deep Neural Network)之外的深度学习模型打开了另一扇门.然而,现有的深度集成模型主要以深度森林为主,深度集成架构较为单一,基学习器的数量与集成方式较为固定,需要探索除深度森林之外的深度集成学习模型架构.另外,实际应用中,很难存在一种深度集成学习模型架构能够在不同数据集上均取得优异性能,尤其是对于数据特征差异较大的表格型数据集.因此,也需要一种高效的数据自适应的深度集成学习架构设计方法.为此,本文从搜索空间和搜索算法两个层面,研究提出了一种高效的基于代理模型的渐进式深度集成架构搜索方法PMPAS(Proxy Model-based Progressive Architecture Search).首先,通过归纳分析已有深度集成学习模型的特点,给出了深度集成架构的形式化定义.其次,研究提出了两种全新的深度集成架构搜索空间,即基于完全并行的搜索空间和基于有向无环图的搜索空间.然后,在上述两种搜索空间的基础上,研究提出了基于代理模型的渐进式搜索方法与算法,实现从简单到复杂逐步地在搜索空间中进行探索,并采用代理模型作为指导,降低模型评估开销.最后,本文从时间复杂度和空间复杂度两个方面对搜索算法进行分析.在分类、回归等公开的表格型数据集上的大量实验结果表明,通过PMPAS算法搜索得到的深度集成架构,其性能不仅优于已有的集成学习模型、深度学习模型以及以深度森林为代表的深度集成学习模型,而且优于已有的自动化模型选择; 朱光辉祁加豪朱振南袁春风袁春风; 关键词：代理模型

一种基于强化学习的自动化机器学习方法: 本发明公开了一种基于强化学习的自动化机器学习方法，包括以下步骤：使用统一的API接口，屏蔽不同的机器学习算法库之间的异构性，以Python作为编程语言，在Python语言中调用不同机器学习算法库中的算法；将自动化机器学习...; 黄宜华顾荣朱光辉王磊

一种通用后缀树的分布式并行构建方法: 本发明公开了一种通用后缀树的分布式并行构建方法，包括以下步骤：第一步，整合输入序列并将其平均分配给每个计算节点；第二步，并行地统计子序列频数，确定所有的子树构建任务；第三步，将这些子树构建任务按规模尽量均匀地分配给不同的...; 顾荣黄宜华郭晨朱光辉; 文献传递

一种基于强化学习的自动化机器学习方法: 本发明公开了一种基于强化学习的自动化机器学习方法，包括以下步骤：使用统一的API接口，屏蔽不同的机器学习算法库之间的异构性，以Python作为编程语言，在Python语言中调用不同机器学习算法库中的算法；将自动化机器学习...; 黄宜华顾荣朱光辉王磊; 文献传递

一种跨平台统一的大数据SQL查询方法: 本发明公开了一种跨平台统一的大数据SQL查询方法，包括以下步骤：扩展部分SQL语义，为用户提供统一的跨平台SQL查询语言；统一SQL解析器将用户提交的查询语句解析为逻辑查询计划，并根据统一元数据库中保存的元信息，验证查询...; 黄宜华朱光辉尹良良; 文献传递

一种通用后缀树的分布式并行构建方法: 本发明公开了一种通用后缀树的分布式并行构建方法，包括以下步骤：第一步，整合输入序列并将其平均分配给每个计算节点；第二步，并行地统计子序列频数，确定所有的子树构建任务；第三步，将这些子树构建任务按规模尽量均匀地分配给不同的...; 顾荣黄宜华郭晨朱光辉

SCoS:基于Spark的并行谱聚类算法设计与实现被引量：13: 2018年; 谱聚类是一种比传统聚类算法更为高效的算法,其建立在谱图理论基础上,并将聚类问题转化为图的最优划分问题.与传统k-means算法不同的是,谱聚类算法不仅能够在任意形状的样本空间上实现聚类,而且可以收敛至全局最优解.然而,谱聚类算法的计算开销较大,不仅需要计算任意两个样本之间的相似性,而且还需要计算Laplacian矩阵的特征向量.因此,在大规模数据场景下,谱聚类算法存在计算耗时过长甚至无法完成计算的问题.为了解决谱聚类算法在大规模数据场景下的计算性能问题,使得谱聚类算法能够应用在大数据集上,文中基于Apache Spark分布式并行计算框架研究并实现了大规模并行谱聚类算法SCoS,对算法流程中的每个计算步骤进行了并行化.具体的,SCoS主要实现了相似度矩阵构建与稀疏化过程的并行化、Laplacian矩阵构建与正规化过程的并行化、正规化Laplacian矩阵特征向量计算的并行化以及k-means聚类的并行化.为了降低谱聚类算法中大规模样本相似性计算的开销,SCoS采用了基于多轮迭代的并行计算方式实现大规模样本之间的相似性计算.针对大规模谱聚类算法中耗时较长的Laplacian矩阵特征向量求解问题,SCoS基于ScaLAPACK实现了特征向量的并行化求解,同时文中也实现了近似特征向量计算算法,并且对比分析了精确特征向量计算与近似特征向量计算对于谱聚类算法的性能影响.为了进一步提升大规模谱聚类算法的性能,SCoS采取了矩阵稀疏化表示与存储、Laplacian矩阵乘法优化以及k-means聚类中距离计算放缩剪枝等多种优化手段,尽可能地减少计算开销、存储空间开销以及数据传输开销.实验表明,SCoS不仅在聚类效果上要优于传统的聚类算法,而且具有较高的运行效率,特别是在大规模数据集下,仍具有较高的计算性能,并表现出了良好的数据可扩展性和系统可扩展�; 朱光辉黄圣彬袁春风袁春风; 关键词：谱聚类并行化分布式计算 APACHE SPARK

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

朱光辉

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

朱光辉

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈