中央高校基本科研业务费专项资金(CDJXS10182216)
- 作品数:3 被引量:18H指数:2
- 相关作者:尚赵伟张凌峰吴磊房斌陈静更多>>
- 相关机构:重庆大学第三军医大学新桥医院中国人民解放军更多>>
- 发文基金:中央高校基本科研业务费专项资金重庆市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合过抽样和欠抽样的不平衡数据重抽样方法被引量:15
- 2013年
- 在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。
- 吴磊房斌刁丽萍陈静谢娜娜
- 关键词:不平衡数据LINKS
- 特征加权最小最大概率机
- 2012年
- 在最小最大概率机中引入Boosting权值确定方法,构造特征加权最小最大概率机(FWMPM)。利用Boosting方法计算各个特征对分类任务的重要度,把此特征重要度作为原始数据各个特征的权重,对核函数中的内积和欧氏距离进行加权计算,从而可以减轻最小最大概率机被一些弱相关的特征影响。实验结果和理论分析表明,该方法比标准最小最大概率机具有更好的分类性能。
- 李剑尚赵伟张凌峰
- 关键词:最小最大概率机BOOSTING信息增益特征加权
- 基于幅度和相对相位信息的笔迹鉴别被引量:3
- 2011年
- 为提高脱线中文手写体笔迹鉴别的正确率,提出一种基于金字塔对偶树方向滤波器组(PDTDFB)变换的幅度和相对相位信息的脱线手写体笔迹鉴别方法。该方法利用导出幅度分布和基于相对相位的VM、WC分布模型得到文本图像更详实的特征表示,采用具有对称性的RA距离,依据多属性决策的思想,实现幅度和相对相位信息的特征融合。实验结果表明,该方法的鉴别正确率相比PDTDFB变换与广义高斯密度模型相结合方法提高了2.2%。
- 李文龙尚赵伟张凌峰王杰胡胜雄
- 关键词:笔迹鉴别