您的位置: 专家智库 > >

刘福伦

作品数:4 被引量:11H指数:2
供职机构:西南石油大学计算机科学学院更多>>
发文基金:国家自然科学基金四川省教育厅自然科学科研项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇相似度
  • 2篇聚类
  • 1篇代表选举
  • 1篇选举
  • 1篇学习算法
  • 1篇主动学习算法
  • 1篇聚类集成
  • 1篇加权
  • 1篇加权策略
  • 1篇二叉树
  • 1篇覆盖约简
  • 1篇PAGERA...
  • 1篇粗糙集

机构

  • 4篇西南石油大学
  • 1篇四川民族学院

作者

  • 4篇刘福伦
  • 3篇闵帆
  • 2篇王宏杰
  • 1篇张本文
  • 1篇张林

传媒

  • 2篇智能系统学报
  • 1篇计算机应用
  • 1篇江苏科技大学...

年份

  • 1篇2019
  • 2篇2018
  • 1篇2017
4 条 记 录,以下是 1-4
排序方式:
邻域覆盖分类的两种加权策略被引量:1
2018年
邻域覆盖粗糙集在机器学习的理论与应用中都起着重要作用。结合覆盖约简和代表选择,已有的研究在符号数据上取得了很好的分类结果;然而,已有方法使用简单投票策略,不能有效解决分类冲突问题。对此提出两种新的加权策略,在分类阶段确定投票的模式。第一种基于Cfs Subset EVal和Best First根据属性重要度加权,第二种基于预测点与代表的Overlap相似度加权。利用加州大学欧文分校(UCI)的10个公开数据集进行实验,并与其他三种常用分类算法进行对比。实验用F-measure值对算法性能进行评定。实验结果表明,两种新策略均能提升分类精度,其中属性加权策略效果更明显。此外,属性加权策略特别适用于对生命领域数据集进行分类。
王轩刘福伦张林王宏杰闵帆
关键词:相似度覆盖约简
基于PageRank的主动学习算法被引量:1
2019年
在许多分类任务中,存在大量未标记的样本,并且获取样本标签耗时且昂贵。利用主动学习算法确定最应被标记的关键样本,来构建高精度分类器,可以最大限度地减少标记成本。本文提出一种基于PageRank的主动学习算法(PAL),充分利用数据分布信息进行有效的样本选择。利用PageRank根据样本间的相似度关系依次计算邻域、分值矩阵和排名向量;选择代表样本,并根据其相似度关系构建二叉树,利用该二叉树对代表样本进行聚类,标记和预测;将代表样本作为训练集,对其他样本进行分类。实验采用8个公开数据集,与5种传统的分类算法和3种流行的主动学习算法比较,结果表明PAL算法能取得更好的分类效果。
邓思宇刘福伦黄雨婷汪敏
关键词:PAGERANK聚类二叉树
SUCE:基于聚类集成的半监督二分类方法被引量:4
2018年
半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、 kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。
闵帆王宏杰刘福伦王轩
关键词:聚类聚类集成
代价敏感代表选举的邻域覆盖粗糙集分类方法被引量:5
2017年
基于邻域的覆盖粗糙集已经被用于构建数值型数据分类器.文中将该理论应用于针对名词性数据的代价敏感分类器.首先,用对象间的相似关系确定每个对象的相似度阈值,并通过该阈值确定每个对象的邻居以及邻域;然后,通过覆盖约简算法选举出一组称为代表的对象;最后,当需要对新对象进行分类时,计算它与各代表之间的曼哈顿距离,并综合误分类代价向量制定不同分类策略,以最小化误分类代价期望值.在UCI数据库中的数据集之上与主流的代价敏感ID3和C4.5算法对比,结果表明新算法能取得更好的分类效果.
刘福伦闵帆张本文
关键词:相似度
共1页<1>
聚类工具0