国家高技术研究发展计划(2007AA02Z329) 作品数:13 被引量:27 H指数:3 相关作者: 李霞 张帆 高磊 王亚东 李光 更多>> 相关机构: 哈尔滨医科大学 首都医科大学 哈尔滨工业大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 北京市教育委员会科技发展计划 更多>> 相关领域: 医药卫生 生物学 自动化与计算机技术 农业科学 更多>>
药物靶蛋白结构域的特性研究 2010年 目的结构域是蛋白质的结构单位和功能单位,研究药物靶蛋白结构域的特性对预测新的药物靶蛋白具有重要的意义。方法利用蛋白质互作、蛋白质结构域及药物靶蛋白数据,通过统计学检验分析药物靶蛋白与非药物靶蛋白二者结构域是否存在差异。结果药物靶蛋白含有结构域的数量与非药物靶蛋白含有结构域的数量存在显著差异(P=1.03×10-6),且药物倾向于靶向含有两个结构域的蛋白质。此外,药物靶蛋白结构域多以α螺旋为主或以α螺旋和β折叠混合的结构为主。结论研究结果表明药物靶蛋白与非药物靶蛋白二者含有结构域的个数存在显著差异,此结论为预测新的药物靶蛋白提供理论基础。 王晨曲 李冬果 李霞关键词:结构域 前馈环中疾病基因的分布特性研究 2009年 目的研究人类基因转录调控网络的特异性模块及转录调控模块中不同位置上基因的功能。方法通过与随机网络比较得到人类基因转录调控网络中具有显著意义的调控模块,并利用超几何分布算法计算特异性模块不同位置上疾病基因的分布显著性。结果前馈环在人类基因转录调控网络中分布频率具有特异性(P<0.01),疾病基因在该类模块的特异调控子和功能反应子中比例显著偏高(P<0.01)。结论前馈环是人类基因转录调控网络的主要模块。其中,前馈环中特异调控子起信息传导作用,功能反应子为功能执行者,在疾病的发生发展中起重要作用。 刘金凤 高磊 刘永宾 李霞关键词:转录调控 疾病基因 结合已有知识体系的酒精中毒相关的SNP单体型及其相关基因挖掘 被引量:1 2008年 高通量的单核苷酸多态(single nucleotide polym orphism,SNP)检测技术与已有的知识体系(如KEGG,GO数据库等)为与疾病相关的SNP单体型及相关基因挖掘提供了有力支撑.本研究对高通量SNP基因型数据,采用4种SNP单体型板块(block)识别方法(置信区间、FGT、连锁不平衡的稳定连接以及单体型板块融合技术),用聚类分析方法验证其效能,通过风险分析方法确定酒精中毒相关的SNP单体型,并基于已有知识体系建立SNP单体型与基因的映射,通过查询NCBI SNP与gene数据库定位SNP单体型板块,确定候选基因,最后结合KEGG,Biocarta及GO数据库进行基因功能注释.在对人类22对常染色体的分析中,寻找到可能与酒精中毒相关的159个单体型板块,包含227个SNP单体型,并预测其中102个SNP单体型可能会增加酒精中毒的发病风险.挖掘得到了121个酒精中毒相关基因,并进一步进行可靠的生物学功能注释验证.结果提示:采用聚类效果验证及风险分析的单体型识别机制,基于单体型的疾病相关基因定位并结合已有知识体系的疾病相关基因挖掘策略,不仅能大大缩减SNP数据挖掘的工作量,实现复杂疾病相关基因的精细定位,而且对于多因素复杂疾病发病机制的探索将更有指导意义. 张瑞杰 李霞 姜永帅 刘桂友 李传星 张帆 肖云 宫滨生关键词:酒精中毒 基因定位 CDICdb:一个疾病-离子通道关联库 2011年 离子通道是镶嵌在生物膜上的蛋白质,提供了离子出入膜的生物孔道。它们不但与许多基本的生理功能相关,现有研究发现它们还与许多疾病的发生发展有密切的关系。疾病-离子通道关联库(DataBase of Correlations between Disease and Ion Channel,CDICdb)实现了依据离子通道查询相关的疾病,以及依据疾病查询相关离子通道和离子通道关联的KEGG库中Pathway通路的信息的功能。利用本数据库提供的关联网络,研究人员可以对离子通道病有更全面的认识。CDICdb是一个关系型数据库,现在可以免费地使用,网址为:http://db.cdicdb.com/channel2disease/index.html。 胡贵祥 李霞关键词:数据库 疾病 离子通道 PATHWAY 谱聚类集成的淋巴结超声图像分割算法 被引量:4 2009年 为了对低信噪比的超声图像进行有效分割,提出一种谱聚类集成的超声图像分割算法.首先用改进的全变差去噪模型对超声图像进行有效的去噪;然后用聚类集成的方法对去噪后的图像进行图像分割,基聚类器采用K均值算法,集成采用改进的谱聚类算法;最后用K均值算法对谱聚类集成的结果进行再次聚类,得到最终的集成聚类分割结果.实验结果表明,与现有的方法相比较,该算法分割效果更好. 朱长明 李晶 顾国昌 宫滨生 刘海波 沈晶关键词:谱聚类 聚类集成 K均值 全变差 一种改进的基于奇异值分解的隐私保持分类挖掘方法 被引量:16 2012年 隐私保护是数据挖掘研究的重要内容之一,目前已经提出了大量隐私保持的数据挖掘算法.基于奇异值分解的方法是其中重要的一种,它是一种基于数据扰动的方法.现有的基于奇异值分解的隐私保持数据挖掘方法对所有样本和属性都进行同样强度的扰动.但不同的样本和属性可能对隐私保护有不同的要求,而且对数据挖掘的重要性也可能不同,因此最好可以对他们进行不同程度的扰动.本文对基于奇异值分解的数据扰动方法进行改进,使之可以对不同的样本和属性进行不同程度的扰动.并在此基础上提出了一种改进的隐私保持分类挖掘方法.实验表明,与原有的基于奇异值分解的方法相比,在保证数据可用性的前提下,本文方法可以对隐私数据提供更好的保护. 李光 王亚东关键词:隐私保持 数据挖掘 奇异值分解 基于概率论的隐私保持分类挖掘 2012年 在现有的基于数据扰动的隐私保持分类挖掘算法中,扰动数据和原始数据相关联,对隐私数据的保护并不完善,且扰动算法和分类算法耦合度高,不适合在实际中使用。为此,提出一种基于概率论的隐私保持分类挖掘算法。扰动后可得到一组与原始数据独立同分布的数据,使扰动数据和原始数据不再相互关联,各种分类算法也可直接应用于扰动后的数据。 李光 王亚东 苏小红关键词:数据挖掘 隐私保持 随机噪声 决策树 人类蛋白质互作网络hub蛋白与其结构域关联分析 被引量:1 2008年 hub蛋白质作为参与较多互作的"中心蛋白",在实现蛋白质功能和生命活动中发挥着关键作用.而结构域作为蛋白质上的基本功能区域,决定着蛋白质功能及蛋白质互作的情况.互作网络中hub蛋白质和结构域对于蛋白质功能的实现均起到决定性的作用.对蛋白质互作与结构域的关系分析表明,蛋白质互作与结构域之间存在着密切的联系.对人类蛋白质互作网络中的hub蛋白与结构域进行关联分析,探讨hub蛋白及其互作partner与结构域数目之间的关系,并通过hub蛋白质之间的互作对相应结构域的关系进行进一步的论证. 王靖 李霞 朱明珠 肖雪关键词:蛋白质互作网络 连通度 结构域 基于网络特征的药物靶蛋白识别 被引量:1 2008年 蛋白质很少孤立得发挥作用,往往通过网络中彼此互作来共同行使功能.因此分析药物靶蛋白在生物学网络中的性质将十分有助于从信息学角度理解药物的作用机制.但目前尚无研究对药物靶蛋白在人类蛋白质互作网络中的拓扑特性给与具体的分析和描述.本文首先将药物靶蛋白映射到人类蛋白质互作网络中,进而分析了药物作用靶蛋白在互作网络中的5种拓扑指标,并与互作网络中全蛋白质组集合及非药物靶点集合的拓扑指标进行了对比.结果显示,药物靶蛋白之间具有更高的连通性,信息能够得到更快得传递.基于这些拓扑特征,将互作网络中的所有蛋白进行排序.发现排序在前100位的蛋白中有48个是Drugbank中记录的药物靶点,另外的52个蛋白中有9个蛋白已在TTD,Matador等数据库中被记录为药物靶点,还有部分蛋白通过文献检索被证实为药物靶点. 朱明珠 高磊 李霞 刘志成关键词:药物靶点 拓扑特征 microRNA层面上癌症的公共机制 被引量:3 2009年 microRNAs(miRNA)是一类内源性的非编码小RNA。已有研究表明miRNAs的靶基因中有不少癌症的相关基因。为了全面研究miRNA与癌症的关系,作者将19种癌症的相关基因集合分别富集到494个miRNAs靶基因集合上,得到各类癌症所富集的miRNAs。结果发现19种癌症仅集中地富集在144个miRNAs上,由此验证了癌症在miRNAs上的公共机制。在此基础上,作者对癌症富集较多的8个miRNAs做了进一步研究,结果发现这8个miRNAs均为高度保守的miRNAs,且它们的靶基因集合一致富集在基因本体论(gene ontology,GO)的基本生物学过程上,并与转录因子活性以及蛋白激酶活性相关。另一方面,在基于miRNA构建的癌症网络中,前列腺癌与乳腺癌,结肠癌与乳腺癌之间共享较多的miRNAs,表明了这些癌症在miRNA层面上存在密切的关系。 肖雪 李霞 张绍军关键词:MICRORNA 癌症