吴非
- 作品数:4 被引量:4H指数:1
- 供职机构:南京航空航天大学计算机科学与技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于k维树的模糊C均值聚类算法被引量:2
- 2015年
- 初始聚类中心的选择极大地影响了模糊C均值聚类算法的性能,一个好的初始聚类中心能显著加快算法的收敛速度和减少算法的运行时间。本文提出一种新的基于k维树的模糊C均值聚类算法。通过使用k维树的方法分割原始数据集得到多个网格,并选取网格的加权中心作为新的数据点构成一个简化的数据集,在此基础上可快速查找一组距离实际聚类中心较近的初始聚类中心,显著减少模糊C聚类算法的迭代次数。通过在16个人工数据集和一组真实图像数据上的实验结果表明,数据集的数据量较大时,在不损失聚类精确度的情况下,本算法相对于普通的模糊C均值聚类算法,收敛速度提升了近2倍,算法的运行时间也缩短到经典FCM算法的一半以下。
- 吴非毛宇光
- 关键词:模糊C均值聚类算法初始聚类中心无监督学习
- 基于多表关联的关系数据库多空值估计方法被引量:1
- 2016年
- 由于客观世界的复杂性,信息缺失、不确定是普遍存在的。数据库作为表达现实世界的一种工具,使用空值来表达信息缺失的现象。针对关系数据库中的空值问题,提出一种基于多表关联的多空值估计方法。该方法首先以尽可能少地引入误差的原则确定估计每一列空值的顺序;然后对每一列空值先采用本表的信息进行估计,当预测误差大于给定阈值时,根据该表与其他表的关系形式选择不同的模式引入多表信息来提高预测的准确度。实验结果表明该方法估计空值的效果与其他方法相比有较高的准确率。
- 吴非毛宇光
- 关键词:关系数据库空值模糊聚类
- 基于数据流的测试用例自动生成研究被引量:1
- 2014年
- 目前的数据流测试技术存在缺乏具体的数据驱动方法,测试用例的生成过程没有与测试需求结合起来等问题。基于此,文中提出一种自动生成测试用例的模型(TRGA),利用控制流图(CFG)计算生成测试用例所需的变量的定义使用对,使用数据类型结构图(DTG)来作为创建测试对象的数据驱动,利用遗传算法的搜索能力来生成数据,并提出了一种新的适应度计算方法。实验结果表明,该模型能够在减少搜索时间,降低生成测试用例规模的同时达到较高的测试覆盖率。
- 戴翔毛宇光吴非薛一帆
- 关键词:数据流控制流图适应度测试用例
- 一种有效的估计关系数据库中空值的方法被引量:1
- 2016年
- 由于客观世界的复杂性,信息缺失、不确定信息是普遍存在的。数据库作为表达现实世界的一种工具,使用空值来表达信息缺失的问题。针对关系数据库中的空值问题,提出一种基于模糊聚类和线性回归的空值估计方法。该方法首先对数据表中的数据进行挖掘,找出与被估计属性相关联的属性集。该过程仅利用数据本身提供的信息,避免了由专家决定条件属性时由于主观性造成的误差。其次根据所得属性集进行模糊聚类得到对原始数据的一个划分,再基于所得分簇和线性回归给出一个估计关系表中空值的方法。最后利用平均绝对错误率来衡量算法估值的准确率。实验结果表明该方法估值的结果与其他方法相比具有较高的准确率。
- 刘力王立松吴非
- 关键词:关系数据库空值模糊聚类多元线性回归