江苏省高校自然科学研究项目(10KJA33034)
- 作品数:4 被引量:15H指数:2
- 相关作者:陈峰赵杨柏建岭荀鹏程彭志行更多>>
- 相关机构:南京医科大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金江苏省高校优势学科建设工程资助项目更多>>
- 相关领域:医药卫生更多>>
- 全基因组关联研究中的统计分析方法被引量:12
- 2011年
- 随着人类基因组计划的完成,疾病的全基因组关联研究成为可能。该类研究的数据特点是:高维、小样本。面对浩瀚的数据,传统分析方法受到严重挑战。文中介绍全基因组关联研究中的数据分析策略和步骤,包括质量控制、分析、结果表示等,并对全基冈组关联研究的局限性和目前统计分析方法的不足进行讨论。
- 陈峰柏建岭赵杨荀鹏程
- 关键词:全基因组关联研究数据管理统计分析
- 线性混合效应模型的惩罚变量选择被引量:1
- 2014年
- 目的研究基于惩罚的线性混合效应模型变量选择原理和方法。方法对线性混合效应模型中的固定效应施加惩罚,采用Lasso和SCAD进行变量选择,通过两步迭代算法估计惩罚似然,利用BIC原则选择惩罚参数。通过广泛的模拟研究评价Lasso和SCAD在线性混合效应模型变量选择中的性质表现,并应用于真实数据的数量性状位点选择。结果模拟研究和实际应用显示,在线性混合效应模型中,两步迭代算法简单可行,基于惩罚的变量选择方法能够有效识别有意义的协变量。结论基于惩罚的策略为线性混合效应模型提供了行之有效的变量选择方法。
- 陈峰
- 关键词:线性混合效应模型数量性状位点
- 随机生存森林在大规模基因分型肺癌预后关联性研究中的降维作用被引量:1
- 2012年
- 目的探索随机生存森林在大规模测序肺癌随访研究资料中的降维效果,为进一步建立预后预测模型提供依据。方法利用随机生存森林法对120位肺癌患者399个单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点进行降维分析,筛选出重要性评分较高且错分率较低的SNPs子集,再对该子集建立多元Cox比例风险模型,并利用交叉验证法评价模型的预测效果。结果随机生存森林法筛选出25个重要的SNPs,控制临床协变量(临床分期、是否手术、组织病理学类型)的多元Cox比例风险模型显示有4个位点有统计学意义。交叉验证结果表明,该模型的平均准确度达83.63%。结论对高维关联性研究数据利用随机生存森林法先去噪降维,再作进一步分析,有助于后续预后预测模型的建立。
- 陈干霞张汝阳赵杨胡志斌陈峰
- 关键词:肺肿瘤
- 全基因组关联性研究的基因型填补被引量:2
- 2011年
- 目的以肺癌全基因组关联性研究为例,介绍基因型填补的基本原理和过程。方法利用MACH软件,基于1000Genome模板,以一号染色体体为例,对Affymatrix公司6.0芯片上的位点进行基因型填补。结果填补后,一号染色体上共有531497个位点。结论基因型填补可以恢复全基因组关联性研究中未基因分型或缺失的位点的信息。
- 赵杨戴俊程柏建岭彭志行于浩沈洪兵陈峰
- 关键词:MACH