国家自然科学基金(61173163)
- 作品数:4 被引量:18H指数:3
- 相关作者:祝孔涛王乐刘胜蓝冯林李兴建更多>>
- 相关机构:大连理工大学南阳理工学院宁波大红鹰学院更多>>
- 发文基金:国家自然科学基金宁波市自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种不确定数据集上频繁模式挖掘的近似算法被引量:8
- 2014年
- 为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。
- 王水祝孔涛王乐
- 关键词:数据挖掘频繁项集
- 一种新的局部空间排列算法
- 2013年
- 局部切空间排列算法(local tangent space alignment,LTSA)是一种经典的非线性流形学习方法,能够有效地对非线性分布数据进行降维,但它无法学习局部高曲率数据集.针对此问题,给出了描述数据集局部曲率的参数,并提出一种局部最小偏差空间排列(locally minimal deviation spacealignment,LMDSA)算法.该算法考虑到局部切空间低鲁棒性的缺陷,在计算局部最小偏差空间的同时,能够发现数据的局部高曲率现象,通过参数控制及邻域间的连接信息,减少计算局部高曲率空间的可能,进而利用空间排列技术进行降维,手工流形及真实数据集的实验证实了该算法学习局部高曲率数据集的有效性.
- 刘胜蓝冯林金博吴振宇
- 关键词:流形学习
- 基于基元相关性描述子的图像检索被引量:3
- 2016年
- 图像检索系统性能很大程度上取决于提取的图像描述子,其中颜色差分直方图(color difference histogram,CDH)已经在图像检索中显示出了较好的性能.但是这种描述子仍然有一定的局限性:1)只考虑到了像素间颜色差分的整体分布;2)忽略像素间的空间位置分布.因此提出了1种新的基元相关性描述子(texton correlation descriptor,TCD)提取图像特征,并将其应用于图像检索系统中.具体提取过程分为3个步骤:1)利用图像底层特征(颜色和局部二值模式)检测一致性区域,选择图像中包含区分性信息的局部区域;2)提出颜色差分特征和基元频率特征分别描述图像像素间的对比度和空间位置信息,其中颜色差分特征融合了描述局部邻域的颜色差分相关性统计和全局颜色差分直方图,基元频率特征也融合了描述局部邻域的基元频率相关性和基元频率直方图;3)联合一致性区域中的这2种特征得到最后的TCD描述子.这种特征描述了图像中2种互相独立并互相补充的特性:对比度和空间位置关系,并同时考虑到了这2种特性在局部和全局区域中的描述,因此在图像检索实验中会有更好的性能.在图像数据集中的实验结果显示了TCD描述子的检索效果明显优于其他几种特征描述子,证实了TCD描述子在图像检索中的有效性和稳定性.
- 吴俊刘胜蓝冯林于来行
- 关键词:图像检索
- 高效用项集挖掘算法被引量:9
- 2013年
- 现有高效用项集挖掘算法主要采用项集枚举和两阶段方法 (或称为候选项集测试方法),后者时空效率的主要瓶颈在于候选项集过多。针对该问题,采用降低候选项集twu值,及利用项最大最小效用值来估计候选项集的效用值等策略,进而进行剪枝,从而有效地提高挖掘算法的时间和空间效率。实验采用真实数据集和合成数据集进行算法性能测试,实验结果表明改进后的算法性能得到较大的提高。
- 祝孔涛李兴建王乐
- 关键词:频繁项集候选项集数据挖掘