王辉兵
- 作品数:5 被引量:21H指数:3
- 供职机构:大连理工大学更多>>
- 发文基金:国家自然科学基金辽宁省自然科学基金浙江省科技厅科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于KL散度的多视角距离度量学习方法
- 本发明公开了一种基于KL散度的多视角距离度量学习方法。首先,将多个视角下维数不同的特征映射进同一维数的子空间内;其次,在不同视角下,利用KL散度定义各视角下距离度量与统一的距离度量所构造样本间相似性的差异;再次,最大化各...
- 冯林王辉兵
- 文献传递
- 不确定数据流中频繁模式的并行挖掘算法被引量:6
- 2016年
- 不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapReduce的并行挖掘算法。该算法需要两次MapReduce就可以从一个滑动窗口中挖掘出所有的频繁模式。实验中,多数情况下通过一次MapReduce就可以挖掘到全部频繁项集,并且能按数据量大小均匀地把数据分配到各个节点上。实验验证了该算法的时间效率能提高1个数量级。
- 常艳芬王乐王辉兵
- 关键词:不确定数据数据挖掘
- 高维数据中鲁棒激活函数的极端学习机及线性降维被引量:12
- 2014年
- 极端学习机(extreme learning machine,ELM)训练速度快、分类率高,已经广泛应用于人脸识别等实际问题中,并取得了较好的效果.但实际问题中的数据往往维数较高,且经常带有噪声及离群点,降低了ELM算法的分类率.这主要是由于:1)输入样本维数过高;2)激活函数选取不当.以上两点使激活函数的输出值趋于零,最终降低了ELM算法的性能.针对第1个问题,提出一种鲁棒的线性降维方法(RAF-global embedding,RAF-GE)预处理高维数据,再通过ELM算法对数据进行分类;而对第2个问题,深入分析不同激活函数的性质,提出一种鲁棒激活函数(robust activation function,RAF),该激活函数可尽量避免激活函数的输出值趋于零,提升RAF-GE及ELM算法的性能.实验证实人脸识别方法的性能普遍优于使用其他激活函数的对比方法.
- 冯林刘胜蓝张晶王辉兵
- 关键词:极端学习机线性降维高维数据神经网络
- 一种基于离散度平衡的降维算法被引量:3
- 2016年
- 已有的监督维数约简算法大都通过最大化类间离散度总和等相关手段选取判别能力较强的子空间,使得原始空间中距离较小的一些类易被忽略而在子空间中出现不同类的融合现象.为此,提出一种基于离散度平衡的降维算法——离散度平衡投影.该算法利用对称相对熵来衡量样本间的离散度,将对称相对熵与离散度平衡的概念结合,使得算法在降维过程中保持较大类间离散度的同时更加注重较小的类间离散度,以实现类间散度平衡的目的;为了充分使用现实生活中大量无标签样本,通过保持所有样本间拉普拉斯图结构进一步提出了半监督离散度平衡投影.对Soybean,Isolet,COIL20等标准数据集进行维数约简的实验结果表明,文中算法具有较好的降维效果.
- 王辉兵冯林吴振宇
- 关键词:相对熵
- 高维图像数据分类方法研究
- 随着信息技术时代的发展,信息采集手段与技术逐渐增强,人们所获得的高维数据(High-dimensional data)正在以指数的形式快速增长,越来越多的不确定性数据和海量模糊数据体现了高维小样本的特征,高维数据出现在人...
- 王辉兵
- 关键词:图像分类高维数据
- 文献传递