您的位置: 专家智库 > >

李娟

作品数:5 被引量:22H指数:2
供职机构:西安电子科技大学计算机学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇自适
  • 2篇自适应
  • 2篇相似度
  • 1篇学习矢量量化
  • 1篇样本密度
  • 1篇矢量
  • 1篇矢量量化
  • 1篇数据分类
  • 1篇亲和
  • 1篇全局信息
  • 1篇自适应学习
  • 1篇最近邻
  • 1篇最近邻算法
  • 1篇相似度函数
  • 1篇分散度

机构

  • 5篇西安电子科技...
  • 4篇陕西师范大学

作者

  • 5篇王宇平
  • 5篇李娟

传媒

  • 2篇自动化学报
  • 1篇模式识别与人...
  • 1篇华中科技大学...
  • 1篇西安电子科技...

年份

  • 2篇2015
  • 2篇2014
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
自适应边界逼近的原型选择算法被引量:1
2015年
针对传统原型选择算法易受样本读取序列、异常样本等干扰的缺陷,通过分析原型算法学习规则,借鉴最近特征线法思想,改进传统原型算法,提出一种自适应边界逼近的原型选择算法.该算法在原型学习过程中改进压缩近邻法的同类近邻吸收策略,保留更优于当前最近边界原型的同类样本,同时建立原型更新准则,并运用该准则实现原型集的周期性动态更新.该算法不仅克服读取序列、异常样本对原型选取的影响,而且降低原型集规模.最后通过人工数据和UCI基准数据集验证文中算法.实验表明,文中算法选择的原型集比其他算法产生的原型集更能体现数据集的分布特征,平均压缩率有所提高,且分类精度与运行时间优于其他算法.
李娟王宇平
基于维样本近邻区间的分类算法研究被引量:1
2012年
针对传统KNN算法忽略样本分布对分类的影响,易受到孤立样本、噪音等干扰,时间代价大等问题,提出了一种改进的近邻分类算法.该算法首先采用类维样本存储,打破了样本的整体性,转换了训练样本存储模式;其次按类维度寻求未知样本的类维近邻域,计算类维相似度进而得到未知样本的类别相似度;最后以最大类别相似度标识未知样本.该算法提高了分类效率,降低了独立样本对样本分类的影响.同时可处理连续型和标识型样本分类,并可适应各类样本分布情况,扩大了算法的应用范围.实验结果表明,该算法较传统的近邻算法与邻域分类算法在分类精度与分类时间上有了较大提升.
李娟王宇平
关键词:最近邻算法
考虑局部均值和类全局信息的快速近邻原型选择算法被引量:10
2014年
压缩近邻法是一种简单的非参数原型选择算法,其原型选取易受样本读取序列、异常样本等干扰.为克服上述问题,提出了一个基于局部均值与类全局信息的近邻原型选择方法.该方法既在原型选取过程中,充分利用了待学习样本在原型集中k个同异类近邻局部均值和类全局信息的知识,又设定原型集更新策略实现对原型集的动态更新.该方法不仅能较好克服读取序列、异常样本对原型选取的影响,降低了原型集规模,而且在保持高分类精度的同时,实现了对数据集的高压缩效应.图像识别及UCI(University of California Irvine)基准数据集实验结果表明,所提出算法集具有较比较算法更有效的分类性能.
李娟王宇平
关键词:数据分类自适应学习
基于样本密度和分类误差率的增量学习矢量量化算法研究被引量:9
2015年
作为一种简单而成熟的分类方法,K最近邻(K nearest neighbor,KNN)算法在数据挖掘、模式识别等领域获得了广泛的应用,但仍存在计算量大、高空间消耗、运行时间长等问题.针对这些问题,本文在增量学习型矢量量化(Incremental learning vector quantization,ILVQ)的单层竞争学习基础上,融合样本密度和分类误差率的邻域思想,提出了一种新的增量学习型矢量量化方法,通过竞争学习策略对代表点邻域实现自适应增删、合并、分裂等操作,快速获取原始数据集的原型集,进而在保障分类精度基础上,达到对大规模数据的高压缩效应.此外,对传统近邻分类算法进行了改进,将原型近邻集的样本密度和分类误差率纳入到近邻判决准则中.所提出算法通过单遍扫描学习训练集可快速生成有效的代表原型集,具有较好的通用性.实验结果表明,该方法同其他算法相比较,不仅可以保持甚至提高分类的准确性和压缩比,且具有快速分类的优势.
李娟王宇平
关键词:学习矢量量化样本密度
结合紧密度和分散度的近邻亲和相似度函数被引量:2
2014年
针对传统距离或相似度度量未考虑个体样本对整体样本集影响的情况,对K近邻算法提出了一种相似度改进策略.首先提出了一种新的亲和距离函数,以样本对整体样本集的紧密度和分散度为关注点;其次在亲和距离函数的基础上,提出了一种新的基于紧密度和分散度的亲和相似度函数,并将其作为K近邻算法相似度度量函数;最后通过理论分析及18个数值类型UCI数据集,以5交叉验证模式对所提出亲和相似度函数与传统距离和相似度函数进行验证对比.实验表明,所提出方法是一种有效的相似度策略,且与高效索引算法相结合,可降低在大规模数据集的分类时间.
李娟王宇平
关键词:分散度
共1页<1>
聚类工具0