- 基于EM的不平衡数据关键质量特性识别被引量:5
- 2012年
- 为了在高维不平衡质量特性数据集中提高关键质量特征识别效率,将EM(ExpectationMaximization)算法引入,通过逐步缩小比例较大数据集内的样本数量来抵消数据不平衡带来的负面影响。算例表明,该方法具有一定的合理性和可行性。
- 闫伟何桢田文萌何曙光
- 关键词:聚类高维不平衡数据
- 复杂产品关键质量特性识别方法被引量:3
- 2012年
- 在复杂产品的关键质量特性(critical-to-quality characteristics,CTQ)识别中,传统方法应用于不平衡数据时会表现出有偏性,即对占类别比例较小的不合格产品识别的性能明显劣于占比例较大的合格样本。为解决以上问题,提出了基于改进信息增益(information gain,IG)算法的复杂产品高维不平衡数据集CTQ识别方法,利用改进IG算法评价标准降低不平衡数据中有偏性的影响,从而有效识别CTQ。算例结果表明该方法可以显著提高不平衡数据关键质量特性识别性能。
- 闫伟何桢田文萌
- 关键词:信息增益
- 基于特征选择的产品关键质量特征识别方法研究
- 产品的关键质量特性(Critical-To-Quality, CTQ)就是能够把顾客的需求具体化的,既与产品质量密切相关又可实际测量的产品特性。本文旨在研究高维制造过程产品CTQ识别的问题。高维制造过程中过程特征众多,各...
- 田文萌
- 关键词:不平衡数据模式识别偏最小二乘回归
- 基于IG的复杂产品关键质量特性识别被引量:9
- 2012年
- 将IG(Information Gain)方法引入高维复杂产品质量特性识别,根据复杂产品制造过程的特点,将产品样本数据集中质量特性与样本质量类别建立联系,构建基于IG的相关性识别模型判别两者之间相关性及质量特性的有用性,从而去掉原始样本数据集中的弱相关特征及冗余特征,识别出对于产品质量具有直接关键影响的关键质量特性。算例结果表明,该方法可以比较有效消除在原始样本数据集中的冗余和不相关特征,适合用于高维复杂产品关键质量特性识别。
- 闫伟何桢田文萌何曙光
- 关键词:IG