杨国兵
- 作品数:2 被引量:8H指数:2
- 供职机构:四川大学化学工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:医药卫生理学更多>>
- 机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型被引量:5
- 2010年
- 我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-近邻(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果.
- 杨国兵李泽荣饶含兵李象远陈宇综
- 关键词:乙酰胆碱酯酶抑制剂机器学习方法
- 机器学习方法用于激素敏感脂肪酶抑制剂活性预测被引量:3
- 2011年
- 对激素敏感脂肪酶,我们构建了表征分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到35个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN),k-近邻(k-NN),连续核密度估计(CKD)和逻辑回归(LR)等机器学习方法建立了激素敏感脂肪酶抑制剂的分类预测模型。对于训练集的200个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别在78.0%-94.0%,69.0%-91.0%和73.5%-92.5%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别在60.0%-74.0%,58.0%-71.0%和61.0%-69.5%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对52个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别在84.6%-92.3%,88.5%-92.3%和86.5%-92.3%。所建模型中,SVM,CKD和LR较好,且明显高于其他文献报道结果。
- 陈彬饶含兵何桦杨国兵李泽荣
- 关键词:机器学习方法