目的通过癌症基因图谱(the cancer genome atlas,TCGA)数据库,利用生物信息学方法构建与肝细胞癌患者生存预后相关的长链非编码RNA (LncRNA)筛选模型,建立肝细胞癌诊断和预后相关的LncRNA,为研究肝细胞癌的发生发展及预后提供新的研究思路,有望成为新的治疗靶点。方法从癌症基因图谱(TCGA)数据库中下载424例肝细胞癌患者的RNA表达谱数据和相应的临床资料,其中包括374例肿瘤组织和50例正常对照。通过R语言的edgeR包,获取在正常组织和肝细胞癌组织中差异表达的LncRNA,并使用单因素Cox回归分析筛选出与预后相关的LncRNA。用lasso回归和多因素回归分析建立与肝细胞癌预后相关LncRNA模型,绘制受试者工作特征曲线,验证其模型的可靠性。结果在TCGA数据库中用单因素生存分析筛选出899个与生存预后相关的LncRNA,进一步用多因素Cox回归,筛选出5个与生存预后最显著相关的LncRNA,并构建肝细胞癌预后模型,其受试者工作特征曲线的曲线下面积表明该模型对肝细胞癌的三年和五年生存率的评估有很好地准确性,可能是肝细胞癌发生发展中的关键基因,为后期临床及动物实验提供研究方向和依据。结论研究确定了肝细胞癌中与生存预后显著相关的5个LncRNA,包括B3GALT5-AS,KC877982.1,MIR7-3JG,PGM5P3-AS1和TBX5-AS1(P<0.01)。其表达特征与患者的存活风险具有较高的关联性,联合检测这5个LncRNA能较准确地预测肝细胞癌患者的三年和五年生存率。
目的利用生物信息学分析方法,探索在肝细胞癌预后评估中扮演重要角色的潜在生物标志物。方法从基因表达综合数据库(gene expression omnibus database,GEO)中收集2019年1月1日~2021年1月1日三个病毒相关性肝细胞癌的转录数据集,共含有52个肝细胞癌肿瘤组织和33个肝细胞癌旁组织(对照组),通过GEO2R进行差异基因的鉴定。利用韦恩图绘制三个数据集的共同差异基因,使用DAVID数据库对共同差异基因进行基因功能富集分析,包括基因本体论(GO)和京都基因与基因组百科全书(KEGG)分析。通过STRING数据库和Cytoscape软件构建蛋白互作网络,根据蛋白之间的连接度,筛选和鉴定出关键基因。基于Kaplan-Meier方法及cBioPortal在线工具,分析关键基因表达与生存预后的相关性。结果基于三个芯片数据集,共筛选出423个共同差异表达的基因,这些基因主要富集到细胞分裂以及氧化还原等细胞生物学过程;蛋白互作网络共聚焦到20个关键基因,其中BUB1,BUB1B,CDC20,NCAPG,TPX2和UBE2C的表达改变与不良临床结局之间存在显著的相关性。结论BUB1,BUB1B,CDC20,NCAPG,TPX2和UBE2C在病毒相关性肝细胞癌中异常高表达并且与临床预后相关,可作为病毒相关性肝细胞癌的潜在生物标志物及治疗靶点。