国家教育部博士点基金(20070217051)
- 作品数:2 被引量:30H指数:2
- 相关作者:赵靖沈晶刘海波顾国昌于化龙更多>>
- 相关机构:哈尔滨工程大学江苏科技大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于过采样技术和随机森林的不平衡微阵列数据分类方法研究被引量:9
- 2012年
- 近年来,应用DNA微阵列技术对疾病,尤其是癌症进行诊断,已逐渐成为生物信息学领域的研究热点之一。对比其它的数据载体,微阵列数据通常具有一些独有的特点。针对微阵列数据样本分布不平衡这一特点,提出了一种基于概率分布的过采样技术,通过该技术可以为少数类建立一些合理的伪样本,从而使各类的样本数达到均衡,然后使用随机森林分类器对其进行分类。该方法的有效性和可行性已经在两个标准的微阵列数据集上得到了验证。实验结果显示,与传统的方法相比,该方法可以获得更好的分类性能。
- 于化龙高尚赵靖秦斌
- 关键词:微阵列数据过采样技术概率分布
- 基于DNA微阵列数据的癌症分类问题研究进展被引量:21
- 2010年
- 应用DNA微阵列数据对癌症进行诊断与分型,已经逐渐成为生物信息学领域的研究热点之一。首先概述了基于微阵列数据的癌症分类问题的研究现状与发展趋势。然后简要介绍了微阵列实验的基本步骤,微阵列数据的结构、特点以及用于癌症分类的基本流程。接下来重点从数据预处理、特征基因选择、分类器设计以及分类性能评价等几方面对近10年来的研究成果进行了详细的综述与比较分析。最后,对该领域目前仍然存在的问题进行了归纳并对未来可能的研究方向作出了预测与展望。
- 于化龙顾国昌赵靖刘海波沈晶
- 关键词:微阵列数据癌症分类数据预处理分类器设计