李南
- 作品数:16 被引量:48H指数:5
- 供职机构:福建农林大学计算机与信息学院更多>>
- 发文基金:国家自然科学基金福建省自然科学基金福建省高校产学合作科技重大项目更多>>
- 相关领域:自动化与计算机技术天文地球政治法律文化科学更多>>
- 一种基于混合模型的数据流概念漂移检测算法被引量:13
- 2014年
- 由于在信用卡欺诈分析等领域的广泛应用,学者们开始关注概念漂移数据流分类问题.现有算法通常假设数据一旦分类后类标已知,利用所有待分类实例的真实类别来检测数据流是否发生概念漂移以及调整分类模型.然而,由于标记实例需要耗费大量的时间和精力,该解决方案在实际应用中无法实现.据此,提出一种基于KNNModel和增量贝叶斯的概念漂移检测算法KnnM-IB.新算法在具有KNNModel算法分类被模型簇覆盖的实例分类精度高、速度快优点的同时,利用增量贝叶斯算法对难处理样本进行分类,从而保证了分类效果.算法同时利用可变滑动窗口大小的变化以及主动学习标记的少量样本进行概念漂移检测.当数据流稳定时,半监督学习被用于扩大标记实例的数量以对模型进行更新,因而更符合实际应用的要求.实验结果表明,该方法能够在对数据流进行有效分类的同时检测数据流概念漂移及相应地更新模型.
- 郭躬德李南陈黎飞
- 关键词:概念漂移数据流半监督学习
- 多代表点的子空间分类算法被引量:6
- 2011年
- 多代表点近邻分类克服了传统近邻分类算法的缺点,使用以代表点为中心的模型簇构造分类模型并自动确定近邻数目。此类算法在不同类别的样本存在大量重叠时将导致模型簇数量增大,造成预测精度下降。提出了一种多代表点的子空间分类算法,将不同类别的训练样本投影到多个不同的子空间,使用子空间模型簇构造分类模型,有效分隔了不同类别样本在全空间中重叠的区域,以提高分类性能。与传统的kNN(k nearest neighbor)、kNNModel、SVM(support vector machine)等分类算法的实验对比结果表明,新方法可以对复杂类别结构数据进行有效分类,且较好地提高了分类精度。
- 张健飞陈黎飞郭躬德李南
- 关键词:子空间
- 低代价的数据流分类算法被引量:1
- 2016年
- 现有数据流分类算法大多使用有监督学习,而标记高速数据流上的样本需要很大的代价,因此缺乏实用性.针对以上问题,提出了一种低代价的数据流分类算法2SDC.新算法利用少量已标记类别的样本和大量未标记样本来训练和更新分类模型,并且动态监测数据流上可能发生的概念漂移.真实数据流上的实验表明,2SDC算法不仅具有和当前有监督学习分类算法相当的分类精度,并且能够自适应数据流上的概念漂移.
- 李南
- 关键词:概念漂移数据流
- 基于量子漫步算法的地震震前异常挖掘被引量:1
- 2018年
- 地震特别是大震前会产生一些异常,但这些异常信息难以识别,导致无法充分利用这些异常信息预测地震的发生时间,减少地震带来的灾害影响.针对这个问题,提出一种基于量子漫步算法的震前异常挖掘方法,提取汶川地震和芦山地震的震前射出长波辐射(Outgoing Long-wave Radiation, OLR)异常,进而计算地震前后的P值,异常值CD等数据,通过统计分析方法,探索OLR异常与地震的关系.并且通过实验将该算法扩展到最近十年左右全球发生的8.0级及以上地震,验证该算法的有效性.实验结果表明,该算法能够有效的反映在地震前后会出现OLR异常,而且越大的地震异常越明显.因此,该算法适用于震前异常挖掘.
- 孔祥增江小英郭躬德李南林岭
- 关键词:地震
- 基于少量类标签的概念漂移检测算法被引量:8
- 2012年
- 传统的概念漂移数据流分类算法通常利用测试数据的真实类标来检测数据流是否发生概念漂移,并根据需要调整分类模型。然而,真实类标的标记需要耗费大量的人力、物力,而持续不断到来的高速数据流使得这种解决方案在现实中难以实现。针对上述问题,提出一种基于少量类标签的概念漂移检测算法。它根据快速KNNModel算法利用模型簇分类的特点,在未知分类数据类标的情况下,根据当前数据块不被任一模型簇覆盖的实例数目较之前数据块在一定的显著水平下是否发生显著增大,来判断是否发生概念漂移。在概念漂移发生的情况下,让领域专家针对那些少量的不被模型簇覆盖的数据进行标记,并利用这些数据自我修正模型,较好地解决了概念漂移的检测和模型自我更新问题。实验结果表明,该方法能够在自适应处理数据流概念漂移的前提下对数据流进行快速的分类,并得到和传统数据流分类算法近似或更高的分类精度。
- 李南郭躬德陈黎飞
- 关键词:概念漂移数据流
- 概念漂移数据流分类算法及应用
- 近年来,带有概念漂移的数据流分类问题已经逐渐成为了数据挖掘领域的一个研究热点,涉及的具体应用包括信用卡欺诈分析、网络入侵检测等。不同于传统静态数据集上的分类模型,由于数据流存在数据量无限、可能发生概念漂移等特点,因此数据...
- 李南
- 关键词:数据挖掘数据流子空间概念漂移半监督学习
- 治理理论视野下城市社区党建研究
- 改革开放作为中国的第三次转型,给中国社会的生产方式、阶层结构、人们的思想观念都带来了巨大的变化。社会的转型使得单位制管理体制日趋瓦解,城市社区承担了越来越多原来由政府和企事业单位承担的社会管理和服务的职能。我国面临着“社...
- 李南
- 关键词:中国共产党
- 文献传递
- 面向高速数据流的集成分类器算法被引量:4
- 2012年
- 数据流挖掘要求算法在占用少量内存空间的前提下快速地处理数据并且自适应概念漂移,据此提出一种面向高速数据流的集成分类器算法。该算法将原始数据流沿着时间轴划分为若干数据块后,在各个数据块上计算所有类别的中心点和对应的子空间;此后将各个数据块上每个类别的中心点和对应的子空间集成作为分类模型,并利用统计理论的相关知识检测概念漂移,动态地调整模型。实验结果表明,该方法能够在自适应数据流概念漂移的前提下对数据流进行快速的分类,并得到较好的分类效果。
- 李南郭躬德
- 关键词:概念漂移数据流子空间
- 探究面向空间信息与数字技术专业的Java程序设计教学被引量:1
- 2018年
- 随着大数据时代的到来,Java语言的独特优势促使其在空间信息与数字技术专业的教学中扮演越来越重要的角色。结合当前空间信息与数字技术专业的实际授课情况,本文在分析了Java程序设计课程教学存在问题的基础上,从教学内容与考核方式这两个方面探究了改革的思路以及具体内容。该课程的教学改革有助于最大化Java程序设计课程的教学效果,增强学生的动手实践能力,同时也为其他跨专业学科的教学改革提供了一条可以借鉴的思路。
- 李南
- 关键词:空间信息与数字技术JAVA程序设计教学改革
- 基于子空间集成的概念漂移数据流分类算法被引量:5
- 2011年
- 具有概念漂移的复杂结构数据流分类问题已成为数据挖掘领域研究的热点之一。提出了一种新颖的子空间分类算法,并采用层次结构将其构成集成分类器用于解决带概念漂移的数据流的分类问题。在将数据流划分为数据块后,在每个数据块上利用子空间分类算法建立若干个底层分类器,然后由这几个底层分类器组成集成分类模型的基分类器。同时,引入数理统计中的参数估计方法检测概念漂移,动态调整模型。实验结果表明:该子空间集成算法不但能够提高分类模型对复杂类别结构数据流的分类精度,而且还能够快速适应概念漂移的情况。
- 李南郭躬德
- 关键词:概念漂移数据流子空间