国家高技术研究发展计划(2009AA12Z117)
- 作品数:6 被引量:62H指数:2
- 相关作者:谷琼李文新宁彬袁磊熊启军更多>>
- 相关机构:襄樊学院中国地质大学温州大学更多>>
- 发文基金:国家高技术研究发展计划湖北省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术建筑科学更多>>
- 一种基于重取样的代价敏感学习算法被引量:2
- 2011年
- 大多数非均衡数据集的研究集中于纯重构数据集或者纯代价敏感学习,本文针对数据集类分布非均衡和不相等误分类代价往往同时发生这一事实,提出了一种以最小误分类代价为目标的基于混合重取样的代价敏感学习算法。该算法将两种不同类型解决方案有机地融合在一起,先用样本类空间重构的方法使原始数据集的两类数据达到基本均衡,然后再引入代价敏感学习算法进行分类,能提高少数类分类精度,同时有效降低总的误分类代价。实验结果验证了该算法在处理非均衡类问题时比传统算法要优越。
- 谷琼袁磊宁彬熊启军华丽李文新
- 关键词:非均衡数据集代价敏感学习
- 基于非均衡数据集的代价敏感学习算法比较研究被引量:30
- 2011年
- 大多数非均衡数据集的研究集中于重构数据集或者代价敏感学习,针对数据集类分布非均衡和不相等误分类代价往往同时发生这一事实,在简要回顾代价敏感学习理论和现有学习算法的基础上,将所提出的自适应混合重取样算法,与基于最小误分类代价的MetaCost算法分别进行实验比较,实验表明所提出算法在代价敏感学习中具有一定的优势,实验结果显示非均衡类对代价敏感学习算法性能产生较大影响,当样本类别差异较大时,用样本类空间重构的方法可以得到较好的分类效果.
- 谷琼袁磊熊启军宁彬李文新
- 关键词:非均衡数据集代价敏感学习
- 新型混合重取样算法在岩爆预测中的应用被引量:1
- 2010年
- 针对岩爆现象发生的不均衡及发生机理受多因素影响的问题,在分析重取样技术的基础上,设计并实现了自适应选择近邻的混合重取样算法,并将其用于岩爆危险性预测.该方法结合过取样和欠取样方法的优势,改进了SMOTE过取样算法在产生合成样本过程中存在的盲目性及只能复制生成数值属性的问题,新算法能根据实例样本集内部分布的真实特性,自适应调整近邻选择策略,对不同属性的数据采取不同的复制方法生成新的少数类实例,控制和提高合成样本的质量;并通过对合成之后的数据集,用改进的邻域清理方法进行适当程度欠取样,去掉多数类中的冗余实例和边界上的噪音数据,减少其规模,在一定程度上达到相对均衡,从而,可有效地处理非均衡数据分类问题,提高分类器的性能.该算法在VCR采场岩爆实例上进行实验,预测的结果与实际情况完全一致,表明在工程实例岩爆危险性实例数据非均衡情况下实施混合重取样方案是可行的,预测准确率高,具有良好的工程应用前景.采用该方法可找到岩爆发生的主控因素,为深部开采工程的合理设计与安全施工提供科学依据.
- 谷琼蔡之华朱莉王贤明
- 关键词:岩爆灾害不均衡数据集
- 基于进化规划的新型生物地理学优化算法研究被引量:28
- 2010年
- 生物地理学优化算法是一种新的全局优化算法,但该算法存在搜索能力不强的缺点.针对此不足,提出一种基于进化规划算法的实数编码混合生物地理学优化算法,新算法将进化规划的搜索性与生物地理学优化算法的利用性进行有机结合,从而达到搜索性与利用性的平衡.通过13个高维标准测试函数对算法进行测试,验证了新算法的有效性.与基本生物地理学优化算法和两种经典的进化规划算法进行比较,结果表明新算法优于所比较的三种算法.此外,新算法在收敛速度上优于基本生物地理学优化算法.
- 蔡之华龚文引LING Charles-X
- 关键词:进化规划全局优化混合算法实数编码
- 基于非均衡数据集的新型混合重取样算法被引量:1
- 2010年
- 在分析重取样技术的基础上,设计并实现了自适应选择近邻的混合重取样算法。该方法结合过取样和欠取样方法的优势,改进了SMOTE过取样算法在产生合成样本过程中存在的盲目性及只能复制生成数值属性的问题,新算法能根据实例样本集内部分布的真实特性,自适应调整近邻选择策略,对不同属性的数据采取不同的复制方法生成新的少数类实例,控制和提高合成样本的质量;并通过对合成之后的数据集用改进的邻域清理方法进行适当程度欠取样,去掉多数类中的冗余实例和边界上的噪音数据,减少其规模,在一定程度上达到相对均衡,从而可有效地处理非均衡数据分类问题,提高分类器的性能。
- 谷琼王贤明李文新
- 关键词:非均衡数据集
- 基于改进的SMOTE和RST的新型混合重取样算法
- 2012年
- 分类预测是数据挖掘和机器学习的重要任务之一,非均衡数据广泛存在于真实世界的分类问题中.本文提出一种新的解决非均衡数据集的预处理方法(ImSMOTE-RSTR*).通过改进的SMOTE方法创建新的人工合成少数类实例,并在此基础上应用基于粗糙集理论的子集下近似技术对训练集进行清理,该算法被验证得到较理想的结果.
- 谷琼袁磊宁彬吴钊华丽李文新
- 关键词:非均衡数据集SMOTE粗糙集理论