浙江省研究生创新科研项目(YK2009055)
- 作品数:2 被引量:4H指数:1
- 相关作者:厉力华韩斌祝磊来海锋代琦更多>>
- 相关机构:杭州电子科技大学南佛罗里达大学更多>>
- 发文基金:浙江省研究生创新科研项目浙江省自然科学基金国家自然科学基金更多>>
- 相关领域:生物学医药卫生更多>>
- 基于集成类随机森林方法的神经胶质瘤特征基因选择的研究被引量:4
- 2010年
- 神经胶质瘤(glioma)是一种严重的颅内肿瘤疾病,具有高复发率、高死亡率和低治愈率等特点。利用基因微阵列数据识别与神经胶质瘤相关的特征基因,对该疾病的临床诊断和生物医学研究将起到有益的参考和借鉴作用。作者针对神经胶质瘤数据,提出了一种集成类随机森林特征基因选择方法。首先应用有监督奇异值分解对数据进行降维并粗选出基因;其次应用类随机森林特征选择方法选出特征基因。实验结果显示,该方法对分类器的适应性强;对比其他方法,分类率优势明显;更重要的是,在选出的前50个特征基因中有39个基因与神经胶质瘤或肿瘤细胞生物过程存在着密切联系,证实该方法不仅保持了较高的分类率,而且保证了选择的特征基因具有很强的生物学关联意义,具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩祝磊代琦
- 关键词:神经胶质瘤肿瘤诊断奇异值分解
- 基于“极少”特征标志物的卵巢癌两步预测模型研究
- 2010年
- 卵巢癌是目前死亡率最高的妇科疾病之一,利用信息学手段挑选特征肿瘤标志物已被广泛用于包括卵巢癌在内的肿瘤分类、诊断研究。但是研究中单纯以提高分类率为指标而忽视敏感性和特异性的均衡,且模型为多变量或者复杂模型,成本过高,不太适合临床应用。为此,提出一种基于"极少"特征标志物的两步预测模型,利用先期提取的多个特征作敏感性和特异性测试,然后构建特征变量的两步预测模型。先用单个变量预测,在一个变量不能得到可靠结果时,才增加另一变量参与模型。实验显示,筛选出的PPE8+LPE4和PPE8+LPC0两对变量组合的敏感性和特异性显著、均衡,变量之间的相关性较小,且分类结果和4个变量的分类结果相当,与9个变量的分类率只差4%~5%。所提出的基于极少特征标志物的两步预测模型结构简单,在保持相同分类效果的前提下大大减少了用于预测的变量,为实际应用提供方便,同时在一定程度上节约了经济成本。
- 陈淑飞韩斌厉力华SUTPHEN Rebecca祝磊来海锋
- 关键词:敏感性特异性卵巢癌