海南省自然科学基金(609003)
- 作品数:4 被引量:19H指数:1
- 相关作者:陈绮吴清秀罗林波南雨宏闫庆华更多>>
- 相关机构:海南大学海南软件职业技术学院更多>>
- 发文基金:海南省自然科学基金更多>>
- 相关领域:自动化与计算机技术农业科学更多>>
- 基于聚类的蛋白质一级结构与三级结构关联研究
- 2013年
- 为了建立蛋白质一级结构与三维结构间的关联规则,以蛋白质数据库PDB为数据源,采用K均值聚类方法对蛋白质二级结构中α-螺旋、β-折叠和无规则卷曲的疏水值、偶极矩、解离常数3种属性值序列进行分析。结果表明:80%的螺旋和85%的beta折叠都表现出了自身应有的规律,说明聚类分析方法在蛋白质三级结构预测研究中的合理性和有效性。
- 闫庆华陈绮
- 关键词:蛋白质结构预测K均值聚类关联规则
- 基于蚁群聚类的蛋白质二级结构特征研究
- 2013年
- 通过氨基酸序列来预测蛋白质功能与空间结构一直是生物信息学研究的重点之一。蛋白质二级结构是在一定的氨基酸残基的组成和排列顺序(即蛋白质一级结构)的基础上形成的,不同的氨基酸残基由于具有不同的理化特性,从而形成不同的蛋白质二级结构。文中以蛋白质数据库(PDB)为数据源建立了二级结构数据库,并选取疏水值、等电点等特征,利用蚁群聚类对二级结构进行聚类,其结果所表现出的特征符合既有规律,并为后期的预测工作提供了依据。
- 高冶陈绮
- 关键词:蛋白质二级结构蚁群聚类
- 基于Shark-Search和Hits算法的主题爬虫研究被引量:19
- 2010年
- 主题爬虫是实现垂直搜索引擎的核心技术。介绍主题爬虫的两个重要爬行算法:基于网页内容评价的Shark-Search算法和基于网页链接关系的Hits算法,并分析了各自的优缺点,提出了一种新的主题爬行策略:将上述两种算法的优点结合起来即将基于网页内容评价和基于网页链接关系算法结合起来判断待下载url的优劣,并实现了一个主题爬虫。这种新策略正好弥补了两个算法各自的不足。通过与Shark-Search算法和Hits算法实现的主题爬虫对比,发现用新算法实现的主题爬虫查准率比这两种算法高。
- 罗林波陈绮吴清秀
- 关键词:主题爬虫垂直搜索引擎
- 基于散列辞典的蛋白质二级结构预测方法
- 2011年
- 提出一种易于修改的蛋白质二级结构预测算法。以蛋白质数据银行中PDB文本数据作为数据源,提取所有蛋白质氨基酸序列并以此建立样本数据库,然后针对α-螺旋、β-折叠分别利用基于散列辞典的不同改进方法编程实现蛋白质二级结构序列片段预测,在预测过程中,随机抽取68 421个蛋白质中部分样本作为测试集,对未知序列根据建立的散列辞典中的片段使用正向最大匹配分词法进行切分对比。从实验结果来看,对未知序列片段预测的准确度达到了83.9%,而且能够较好地体现片段之间的连接顺序。
- 南雨宏陈绮
- 关键词:蛋白质二级结构Α-螺旋Β-折叠