您的位置: 专家智库 > >

邹凌云

作品数:9 被引量:14H指数:3
供职机构:国防科学技术大学机电工程与自动化学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:生物学医药卫生更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 9篇生物学
  • 2篇医药卫生

主题

  • 3篇蛋白
  • 3篇支持向量
  • 3篇支持向量机
  • 3篇向量
  • 3篇向量机
  • 3篇膜蛋白
  • 3篇跨膜
  • 3篇跨膜蛋白
  • 2篇神经网
  • 2篇神经网络
  • 2篇主成分
  • 2篇主成分分析
  • 2篇外膜蛋白
  • 2篇网络
  • 2篇模糊支持向量...
  • 2篇非编码
  • 2篇非编码RNA
  • 2篇BP神经
  • 2篇BP神经网
  • 2篇BP神经网络

机构

  • 9篇国防科学技术...

作者

  • 9篇王正志
  • 9篇邹凌云
  • 4篇黄教民
  • 2篇王勇献

传媒

  • 2篇生命科学研究
  • 2篇生物医学工程...
  • 1篇激光生物学报
  • 1篇生物技术通报
  • 1篇Journa...
  • 1篇生物工程学报
  • 1篇2007中国...

年份

  • 3篇2008
  • 6篇2007
9 条 记 录,以下是 1-9
排序方式:
Prediction of Subcellular Localization of Eukaryotic Proteins Using Position-Specific Profiles and Neural Network with Weighted Inputs被引量:3
2007年
Subcellular location is one of the key biological characteristics of proteins. Position-specific profiles (PSP) have been introduced as important characteristics of proteins in this article. In this study, to obtain position-specific profiles, the Position Specific lterative-Basic Local Alignment Search Tool (PSI-BLAST) has been used to search for protein sequences in a database. Position-specific scoring matrices are extracted from the profiles as one class of characteristics. Four-part amino acid compositions and lst-7th order dipeptide compositions have also been calculated as the other two classes of characteristics. Therefore, twelve characteristic vectors are extracted from each of the protein sequences. Next, the characteristic vectors are weighed by a simple weighing function and inputted into a BP neural network predictor named PSP-Weighted Neural Network (PSP-WNN). The Levenberg-Marquardt algorithm is employed to adjust the weight matrices and thresholds during the network training instead of the error back propagation algorithm. With a jackknife test on the RH2427 dataset, PSP-WNN has achieved a higher overall prediction accuracy of 88.4% rather than the prediction results by the general BP neural network, Markov model, and fuzzy k-nearest neighbors algorithm on this dataset. In addition, the prediction performance of PSP-WNN has been evaluated with a five-fold cross validation test on the PK7579 dataset and the prediction results have been consistently better than those of the previous method on the basis of several support vector machines, using compositions of both amino acids and amino acid pairs. These results indicate that PSP-WNN is a powerful tool for subcellular localization prediction. At the end of the article, influences on prediction accuracy using different weighting proportions among three characteristic vector categories have been discussed. An appropriate proportion is considered by increasing the prediction accuracy.
邹凌云王正志黄教民
基于主成分分析-神经网络的非编码RNA预测被引量:6
2007年
预测非编码RNA对认识其调控功能具有重要意义。选择单核苷酸和二核苷酸出现频率作为神经网络分类特征,运用主成分分析方法降低输入数据的维数,去除数据间的相关性,采用Levenberg-Marquardt算法改善网络训练速度。对数据集的测试结果表明,此方法对细菌混合ncRNA的预测精度达到81.3%,对原核生物tRNA的预测精度达到93.3%,表明该方法能有效预测原核生物ncRNA。预测结果还发现两种古细菌的ORF序列在序列特征上与其它细菌和古细菌存在差别。
邹凌云王正志
关键词:非编码RNA主成分分析方差贡献率BP神经网络LEVENBERG-MARQUARDT算法
使用多特征联合变量的支持向量机方法预测外膜蛋白被引量:1
2008年
外膜蛋白(Outer Membrane Proteins,OMPs)是一类具有重要生物功能的蛋白质,通过生物信息学方法来预测OMPs能够为预测OMPs的二级和三级结构以及在基因组发现新的OMPs提供帮助。文中提出计算蛋白质序列的氨基酸含量特征、二肽含量特征和加权多阶氨基酸残基指数相关系数特征,将三类特征组合,采用支持向量机(Support Vector Machine,SVM)算法来识别OMPs。计算了包括四种残基指数的多种组合特征的识别结果,并且讨论了相关系数的阶次和权值对预测性能的影响。在数据集上的十倍交叉验证测试和独立性测试结果显示,组合特征识别方法对OMPs和非OMPs的识别精度最高分别达到96.96%和97.33%,优于现有的多种方法。在五种细菌基因组内识别OMPs的结果显示,组合特征方法具有很高的特异性,并且对PDB数据库中已知结构的OMPs识别准确度超过99%。表明该方法能够作为基因组内筛选OMPs的有效工具。
邹凌云王正志王勇献
关键词:外膜蛋白相关系数支持向量机
基于模糊支持向量机的膜蛋白折叠类型预测被引量:1
2007年
现有的基于支持向量机(support vector machine,SVM)来预测膜蛋白折叠类型的方法,利用的蛋白质序列特征并不充分,并且在处理多类蛋白质分类问题时存在不可分区域.针对这两类问题,提取蛋白质序列的氨基酸和二肽组成特征,并计算加权的多阶氨基酸残基指数相关系数特征,将3类特征融和作为分类器的输入特征矢量,并采用模糊SVM(fuzzy SVM,FSVM)算法解决对传统SVM不可分数据的分类.在无冗余的数据集上测试结果显示,改进的特征提取方法在相同分类算法下预测性能优于已有的特征提取方法;FSVM在相同特征提取方法下性能优于传统的SVM.二者相结合的分类策略在独立性数据集测试下的预测精度达到96.6%,优于现有的多种预测方法,能够作为预测膜蛋白和其它蛋白质折叠类型的有效工具.
邹凌云王正志黄教民
关键词:模糊支持向量机跨膜蛋白折叠类型
利用分散量理论辨识外膜蛋白
2008年
利用分散量的数学理论,提出了基于最小分散增量的蛋白质序列辨识方法.通过多种特征联合对蛋白质序列进行编码,并建立基于最小分散增量的分类器MID_OMP,应用于革兰氏阴性细菌外膜蛋白序列辨识.在数据集上的Jackknife测试中,MID_OMP辨识外膜蛋白和α螺旋跨膜蛋白的准确率达到95.7%,辨识外膜蛋白和球状蛋白的准确率达到91.0%;在14个细菌基因组内挖掘结果显示,MID_OMP具有较高的敏感性和特异性,预测结果的可信度明显优于另外一种OMPs挖掘工具TMBETA-GENOME.
邹凌云王正志黄教民
关键词:外膜蛋白
基于模糊支持向量机的膜蛋白分类研究
2007年
以氨基酸组成为特征对膜蛋白的分类,忽略了序列残基之间的相关性信息,而采用传统支持向量机算法作为分类算法,在解决多类问题时会出现分类盲区问题。针对这两种情况,计算蛋白质序列的氨基酸组成、二肽组成以及6种氨基酸相关系数,将三类特征结合,作为膜蛋白序列的特征向量;同时采用模糊支持向量机作为分类器,解决了传统支持向量机在多类数据识别中的盲区问题。测试结果表明,在相同特征输入下,模糊支持向量机分类性能优于传统支持向量机;在相同分类器的情况下,氨基酸组成、二肽组成和相关系数组合的特征选择方法的分类性能优于只使用其中一类或两类特征的方法;而采取组合特征和模糊支持向量机相结合的分类策略,在独立性数据集测试中的整体预测精度达到97%,优于现有的多种分类策略,是目前最有效的膜蛋白分类方法之一。
邹凌云王正志王勇献
关键词:模糊支持向量机自相关函数膜蛋白跨膜蛋白
基于主成分分析-神经网络的非编码RNA预测
近年来,非编码RNA在生物体内的重要功能日益受到人们的重视。此文运用主成分分析和BP神经网络相结合的方法来预测非编码RNA。主成分分析能够在保留测试数据最大信息量的前提下,有效减少输入数据之间的相关性,减少神经网络的输入...
邹凌云王正志
关键词:非编码RNA主成分分析BP神经网络
文献传递
基于序列拓扑和二阶隐马尔可夫模型的跨膜蛋白亚细胞定位预测
2008年
现有蛋白质亚细胞定位方法针对水溶性蛋白质而设计,对跨膜蛋白并不适用。而专门的跨膜拓扑预测器,又不是为亚细胞定位而设计的。文章改进了跨膜拓扑预测器TMPHMMLoc的模型结构,设计了一个新的二阶隐马尔可夫模型;采用推广到二阶模型的Baum-Welch算法估计模型参数,并把将各个亚细胞位置建立的模型整合为一个预测器。数据集上测试结果表明,此方法性能显著优于针对可溶性蛋白设计的支持向量机方法和模糊k最邻近方法,也优于TMPHMMLoc中提出的隐马尔可夫模型方法,是一个有效的跨膜蛋白亚细胞定位预测方法。
邹凌云王正志黄教民
关键词:跨膜蛋白亚细胞定位
siRNA脱靶效应研究进展被引量:3
2007年
RNA干扰过程中,siRNA和mRNA特异结合能够使得靶基因沉默。但研究证实,siRNA可能与非靶基因结合而导致非靶基因沉默,这种现象称为siRNA脱靶效应。多种真核生物中的RNA干扰实验证实了脱靶效应的存在。对脱靶机制的研究发现脱靶可能与模体匹配、结构和长dsRNA等有关,很多新方法被提出来预测脱靶概率和检测脱靶基因。通过利用siRNApool、化学修饰和生物信息学方法能够尽可能地降低脱靶效应,提高RNAi实验的质量。对脱靶效应方面的研究进行了总结论述。
邹凌云王正志
关键词:RNA干扰
共1页<1>
聚类工具0