朱军 作品数:12 被引量:135 H指数:5 供职机构: 清华大学信息科学技术学院计算机科学与技术系 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 教育部人文社会科学研究重大课题攻关项目 更多>> 相关领域: 自动化与计算机技术 社会学 经济管理 更多>>
贝叶斯深度学习正在觉醒 2017年 正在觉醒的贝叶斯深度学习是发展具有较强鲁棒性和可解释性的人工智能的一种有效途径,能够有效应对“不确定性、不完全信息和开放环境”。 朱军关键词:贝叶斯 不完全信息 人工智能 可解释性 不确定性 鲁棒性 贝叶斯机器学习前沿进展综述 被引量:72 2015年 随着大数据的快速发展,以概率统计为基础的机器学习在近年来受到工业界和学术界的极大关注,并在视觉、语音、自然语言、生物等领域获得很多重要的成功应用,其中贝叶斯方法在过去20多年也得到了快速发展,成为非常重要的一类机器学习方法.总结了贝叶斯方法在机器学习中的最新进展,具体内容包括贝叶斯机器学习的基础理论与方法、非参数贝叶斯方法及常用的推理方法、正则化贝叶斯方法等.最后,还针对大规模贝叶斯学习问题进行了简要的介绍和展望,对其发展趋势作了总结和展望. 朱军 胡文波关键词:非参数方法 正则化方法 神经采样 2017年 神经采样是国际上最近提出的一种基于脉冲神经网络动力学的吉布斯采样算法,是一种有希望在类脑硬件上实现贝叶斯概率推断的算法.神经采样的仿生特点包括考虑神经元间通过发放脉冲来传递信息、突触后膜电压和迟滞效应等.该文首先会介绍国际上在神经采样方面已有的工作,分三小部分:第1部分涉及神经采样的抽象模型,包括其原理和在任意贝叶斯网络中采样的具体模型;第2部分涉及硬件实现,包括用累积发放(I&F)模型近似连续时间神经采样动力学的方法;第3部分通过结合前两部分,涉及用脉冲神经网络动力学训练传统的机器学习模型,并在经典计算机上模拟这个训练过程.第3部分具体包括基于脉冲时间的突触可塑性(STDP)的受限玻尔兹曼机(RBM)的事件驱动相对散度训练算法.最后,我们在训练RBM的相对散度和持续相对散度算法中,用神经采样替代传统的吉布斯采样.该文的工作首先分析了神经采样对初始化状态敏感和混合速度慢的采样特点,然后提出方法消除了这两个采样特点对训练的负面影响.在MNIST数据集上的实验初步显示,基于修正后的神经采样的训练算法能恢复跟传统基于吉布斯采样的算法相似的重构效果.目前在机器学习领域,基于概率的学习算法已发展成主流.神经采样方面的工作为在类脑硬件上实现低能耗的概率模型计算提供方法,未来有希望被用于提高移动设备的智能水平. 萧子豪 朱军关键词:脉冲神经网络 人工智能 条件概率图产生式对抗网络 被引量:1 2020年 产生式对抗网络(generative adversarial networks,简称GANs)可以生成逼真的图像,因此最近被广泛研究.值得注意的是,概率图生成对抗网络(graphical-GAN)将贝叶斯网络引入产生式对抗网络框架,以无监督的方式学习到数据的隐藏结构.提出了条件概率图生成对抗网络(conditional graphical-GAN),它可以在弱监督环境下,利用粗粒度监督信息来学习到更精细而复杂的结构.条件概率图生成对抗网络的推理和学习遵循与graphical-GAN类似的方法.提出了条件概率图生成对抗网络的两个实例.条件高斯混合模型(conditional Gaussian mixture GAN,简称cGMGAN)可以在给出粗粒度标签的情况下从混合数据中学习细粒度聚类.条件状态空间模型(conditional state space GAN,简称cSSGAN)可以在给定对象标签的情况下学习具有多个对象的视频的动态过程. 李崇轩 朱军 张钹关键词:概率图模型 当贝叶斯遇到大数据 2015年 在大数据环境下,贝叶斯推理需要灵活有效的建模方式以及高精度的快速推理算法,现在我们已初步掌握了相关的理论和方法。 朱军关键词:贝叶斯推理 数据环境 建模方式 动态不确定条件下的人工智能 被引量:5 2018年 本文介绍了动态非确定条件下的人工智能最新进展,包括内部不确定性的贝叶斯人工智能、外部不确定性的非完全信息博弈、动态多回合决策以及动态开放环境决策深度强化学习等内容,并给出了今后的研究内容。 唐平中 朱军 俞扬 汤斯亮关键词:贝叶斯 面向对抗样本的深度神经网络可解释性分析 被引量:12 2022年 虽然深度神经网络(Deep neural networks,DNNs)在许多任务上取得了显著的效果,但是由于其可解释性(Interpretability)较差,通常被当做"黑盒"模型.本文针对图像分类任务,利用对抗样本(Adversarial examples)从模型失败的角度检验深度神经网络内部的特征表示.通过分析,发现深度神经网络学习到的特征表示与人类所理解的语义概念之间存在着不一致性.这使得理解和解释深度神经网络内部的特征变得十分困难.为了实现可解释的深度神经网络,使其中的神经元具有更加明确的语义内涵,本文提出了加入特征表示一致性损失的对抗训练方式.实验结果表明该训练方式可以使深度神经网络内部的特征表示与人类所理解的语义概念更加一致. 董胤蓬 苏航 朱军关键词:可解释性 数据财政的市场化运营方案设计与思考 被引量:9 2023年 为研究和探析数据要素市场化的运营过程,将公共数据纳入经济运行系统和国家治理体系,聚焦于新型财政体系建设,从提升政府治理能力和社会协同发展能力的公共服务建设和公共数据价值挖掘视角入手,借鉴土地财政的管理方式以及制度设计机制,将参与主体、公共数据运营体系、实现路径等核心问题作为重点研究对象,讨论了数据财政的可行性框架,提出应重点强化数据财政体系的制度建设和技术支持,充分发挥各市场主体的特定功能以实现协同治理,进而推动数字化转型和数字经济的可持续发展。 赵蓉 林镇阳 聂耀昱 陈维忠 朱军关键词:土地财政 公共数据 最大熵判别主题模型的高效学习算法 被引量:2 2019年 现有的有监督主题模型训练算法的时间复杂度一般线性于主题数量,限制了其大规模应用.基于此种情况,文中提出最大熵判别潜在狄利克雷分配(MedLDA)有监督主题模型的高效学习算法.算法为坐标下降算法,训练分类器的迭代次数少于MedLDA已有的蒙特卡洛算法.算法还利用拒绝采样及高效的预处理技术,将训练的时间复杂度从线性于主题数量降至亚线性于主题数量.在多个文本数据集上的对比实验表明,相比原有的蒙特卡洛算法,文中算法在训练速度上有大幅提升. 陈键飞 朱军语言计算的重要国际前沿 被引量:24 2014年 该文在互联网规模语言信息处理的语境下,从语言计算基础模型、语言分析、语言资源建设、机器翻译、文本内容理解与问答等多个方面,对国内外相关重要动态进行了评述,讨论了语言计算的若干前沿问题及其对中文信息处理近期研究工作所提出的要求。 孙茂松 刘挺 姬东鸿 穗志方 赵军 张钹 吾守尔.斯拉木 俞士汶 朱军 李建民 刘洋 王厚峰 吐尔根.依布拉音 刘群 刘知远关键词:中文信息处理