焦清局
- 作品数:5 被引量:2H指数:1
- 供职机构:上海交通大学更多>>
- 相关领域:生物学农业科学自动化与计算机技术更多>>
- 基于最小编码长度的基因数据聚类
- 2012年
- [目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。
- 汪雪红焦清局常盼盼黄继风
- 关键词:基因聚类有损压缩高斯分布
- 生物复杂网络中功能模块的挖掘
- 网络科学作为一门交叉学科,它的基本理论正渗透到从数理科学到生命科学、工程科学甚至社会科学等众多学科中去。复杂网络的研究引起了世界不同领域科学家的广泛关注。对复杂网络的定性和定量特征的认识和理解是网络时代中一个重要而又具有...
- 焦清局
- 关键词:功能模块层次聚类数据挖掘
- 基于最小编码长度的基因数据聚类(英文)
- 2012年
- [目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。
- 汪雪红焦清局常盼盼黄继风
- 关键词:基因聚类有损压缩高斯分布
- 拟南芥花药基因的共表达分析
- 2010年
- 运用图论中最大团算法,对ATTED-Ⅱ数据库中提供的拟南芥共表达数据进行分析,为进一步研究基因功能提供了较为可靠的数据。文中提出的算法首先根据芯片数据鉴定拟南芥花药基因,然后以ATTED-Ⅱ数据库为基础构建每一个花药基因的共表达网络,最后利用最大团算法从共表达网络中挖掘共表达数据。基于这种方法,系统地分析了每一个拟南芥花药基因的共表达情况,有助于拟南芥花药发育分子机理和基因转录调控的深入研究。实验验证这种方法对拟南芥花药共表达基因的提取十分有效。
- 焦清局刘太岗郑小琪连爱娥黄继风
- 关键词:拟南芥花药共表达最大团
- 拟南芥代谢通路下基因调控网络的构建被引量:2
- 2009年
- 基因调控网络在研究基因之间的调控关系及揭示复杂的生命现象方面有着重要的意义.拟南芥整个生长过程是由基因网络所调控.本文利用拟南芥代谢通路下基因共表达这一属性,结合启动子序列分析的生物信息学方法来预测拟南芥代谢通路下基因的调控关系.基于这种方法,一共预测到2268对具有调控关系的基因对,其中91对为高可信度的调控关系.在我们预测到的调控关系中,有4对调控关系已被实验验证,实验表明本文预测的结果有一定的可靠性.我们预测的拟南芥代谢通路下基因的调控网络,为深入研究代谢通路在植物生长过程中所起的作用提供了方便,有助于进一步研究拟南芥未知基因的功能.
- 焦清局杨仲南黄继风
- 关键词:拟南芥代谢通路基因调控网络生物信息学