陈向坚
- 作品数:19 被引量:49H指数:5
- 供职机构:江苏科技大学计算机科学与工程学院更多>>
- 发文基金:国家自然科学基金中国博士后科学基金江苏省教育厅哲学社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学社会学更多>>
- 面向一致性样本的属性约简被引量:7
- 2019年
- 作为粗糙集理论的一个核心内容,属性约简致力于根据给定的约束条件删除数据中的冗余属性。基于贪心策略的启发式算法是求解约简的一种有效手段,这一手段通常使用数据中的全部样本来度量属性的重要度从而进一步得到约简子集。但实际上,不同样本对于属性重要度计算的贡献是不同的,有些样本对重要度贡献不高甚至几乎没有贡献,且当数据中的样本数过大时,利用全部样本进行约简求解会使得时间消耗过大而难以接受。为了解决这一问题,提出了一种基于一致性样本的属性约简策略。具体算法大致由3个步骤组成,首先,将满足一致性原则的样本挑选出来;其次,将这些选中的样本组成新的决策系统;最后,利用启发式框架在新的决策系统中求解约简。实验结果表明:与基于聚类采样的属性约简算法相比,所提方法能够提供更高的分类精度。
- 高媛陈向坚王平心杨习贝
- 关键词:属性约简聚类启发式算法邻域粗糙集多准则
- 类别近似质量约束下的属性约简方法研究被引量:5
- 2018年
- 利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.
- 李智远杨习贝陈向坚王平心
- 关键词:属性约简启发式算法粗糙集
- 重要度集成的属性约简方法研究被引量:7
- 2018年
- 启发式算法在求解约简的过程中逐步加入重要度最高的属性,但其忽视了数据扰动将会直接引起重要度计算的波动问题,从而造成约简结果的不稳定。鉴于此,提出了一种基于集成属性重要度的启发式算法框架。首先,在原始数据上进行多重采样;然后,在每次循环过程中分别计算各个采样结果上的属性重要度并对这些重要度进行集成;最后,将集成重要度最大的属性加入到约简中去。利用邻域粗糙集方法进行的实验结果表明,基于集成重要度的属性约简算法不仅能够获取更加稳定的约简,而且利用所生成的约简能够得到一致性较高的分类结果。
- 李京政杨习贝窦慧莉王平心陈向坚
- 关键词:属性约简聚类启发式算法邻域粗糙集稳定性
- 基于kd-树的快速邻域分类方法被引量:7
- 2018年
- 有关邻域粗糙集中信息粒化的研究大多以提升邻域分类准确率为目的,往往忽略了高效的邻域搜索策略对提升邻域分类方法时间效率的重要现实意义.为解决该问题,文中借助kd-树型邻域搜索策略,提出了一种基于kd-树的快速邻域分类方法 kdtree-NC,该方法在特征选择与邻域分类两阶段的信息粒化过程中,均采用kd-树搜索策略代替传统邻域分类方法 NC中的线性遍历搜索,很大程度上降低了NC处理大规模数据的时间消耗.在18组UCI数据集上的实验结果表明,与NC方法相比,kdtree-NC方法在特征选择和邻域分类上的时间效率都有显著提升.
- 张艳芹杨习贝陈向坚
- 关键词:邻域粗糙集
- 邻域决策错误率的局部约简方法研究被引量:2
- 2018年
- 传统基于邻域决策错误率的属性约简准则是针对总体分类精度的提升而设计的,未能展现因约简而引起的各类别精度变化情况。针对这一问题,引入局部邻域决策错误率以及局部属性约简的概念,其目的是提升单个类别的分类精度。在此基础上,进一步给出了求解局部邻域决策错误率约简的启发式算法。在8个UCI数据集上的实验结果表明,局部约简不仅是提高各个类别精度的有效技术手段,而且也解决了因全局约简所引起的局部分类精度下降问题。
- 王长宝杨习贝窦慧莉陈向坚王平心
- 关键词:属性约简启发式算法邻域粗糙集
- 邻域决策一致性的属性约简方法研究被引量:11
- 2017年
- 基于邻域决策错误率的属性约简可以在删除冗余属性的同时,提升邻域分类器的留一验证分类精度.但这种约简方式并未充分考虑邻域分类结果在约简前后的差异.为解决这一问题,借助联合分布矩阵,提出了邻域决策一致性的概念,构建了邻域决策一致性与邻域分类精度的调和平均值,并将其作为约简求解的度量准则.在12个UCI数据集上的实验结果表明,所提出的新约简不仅能够有效地提升邻域分类器的决策一致性,而且在多数情况下能够进一步提高邻域分类器的留一验证分类精度.
- 李智远杨习贝徐苏平陈向坚王平心
- 随机模糊粗糙分类方法
- 2017年
- 为进一步提升模糊粗糙集的分类性能,提出随机模糊粗糙分类策略。在原始属性集合上利用随机多重采样的方法,得到一组由原始属性的子集构成的合集,在此基础上采取投票方法实现模糊粗糙分类结果的集成输出。实验结果表明,这种随机模糊粗糙分类器的性能优于传统的模糊粗糙集和随机森林方法,在利用约简时,分类性能能够进一步得到提升,为使用集成思想研究模糊粗糙集的分类机制提供了可行的解决途径。
- 王长宝杨习贝王平心窦慧莉陈向坚
- 关键词:属性约简模糊粗糙集启发式算法
- 模糊粗糙集的稳定约简方法被引量:11
- 2018年
- 属性约简是粗糙集理论研究的核心内容。目前已有的研究成果往往是根据分类性能、代价或不确定性等一些度量来定义及求解约简,并未充分考虑数据扰动有可能对约简结果产生的波动影响。为解决这一问题,提出了一种可以求解稳定约简的启发式算法框架:首先,在全体样本集上利用多次聚类进行多重采样以得到若干边界样本集合;其次,利用集成策略,对每一个属性在所有边界样本集合上求得的重要度进行融合;最后,选择重要度较高的属性加入到约简集合中。在8个UCI数据集上将新算法与传统算法进行对比分析,实验结果表明当数据发生扰动时,所提出的方法不仅能够有效地提升求解约简的时间效率与约简结果的稳定性,而且依据约简所求得分类结果的稳定性也有显著增强。
- 李京政杨习贝王平心陈向坚
- 关键词:属性约简模糊粗糙集稳定性
- 面向分层指标的网络舆情粗糙数据分析系统研究被引量:1
- 2017年
- 针对目前网络舆情预警问题研究中指标体系的构建过于依赖专家经验知识这一不足之处,借助聚类技术,提出了舆情预警指标体系的层次化构建方法,根据不同层次的聚类中心点,利用舆情样本与聚类中心点的距离向量得到不同层次上的指标,并在多个层次上利用粗糙数据分析方法,实现舆情决策的生成与融合,为舆情类别的判别分析问题提供了新的技术手段。
- 窦慧莉王长宝杨习贝陈向坚
- 关键词:粗糙集凝聚层次聚类指标体系
- 二型模糊小波脑情感学习网络在非线性系统辨识中的研究被引量:1
- 2022年
- 针对现有模糊神经网络在辨识具有时变的非线性系统存在辨识精度不高,收敛速度较慢等缺点,提出了一种二型小波模糊脑情感学习网络(T2FWBELN)模型,它结合了模糊逻辑和脑情感学习网络的优点,并在网络结构中使用了小波函数。与其他算法相比,该算法在非线性系统辨识中有着更高的逼近能力。同时,采用模糊C均值算法生成模糊规则,并使用梯度下降法对T2FWBELN的各种参数进行在线调整,降低了参数调整时间。为了进一步验证该模型的有效性和优越性,仿真了两个不确定非线性系统辨识的例子,一个是Mackey-Glass时间序列预测,一个是带有噪声的动态系统辨识。测试结果表明,所提出的模型在处理非线性系统辨识中拥有更高的精度。
- 桑景福陈向坚王平心
- 关键词:非线性系统辨识