您的位置: 专家智库 > >

汪雪红

作品数:2 被引量:0H指数:0
供职机构:上海师范大学信息与机电工程学院更多>>
相关领域:生物学农业科学更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇生物学
  • 1篇农业科学

主题

  • 2篇有损压缩
  • 2篇数据聚类
  • 2篇聚类
  • 2篇基因
  • 2篇基因聚类
  • 2篇高斯
  • 2篇高斯分布
  • 1篇英文

机构

  • 2篇上海师范大学
  • 2篇上海交通大学

作者

  • 2篇黄继风
  • 2篇汪雪红
  • 2篇焦清局
  • 2篇常盼盼

传媒

  • 1篇安徽农业科学
  • 1篇Agricu...

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
基于最小编码长度的基因数据聚类
2012年
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。
汪雪红焦清局常盼盼黄继风
关键词:基因聚类有损压缩高斯分布
基于最小编码长度的基因数据聚类(英文)
2012年
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。
汪雪红焦清局常盼盼黄继风
关键词:基因聚类有损压缩高斯分布
共1页<1>
聚类工具0