糖尿病康复,内容丰富有趣,生活中的好帮手!
糖尿病康复 > 论著|基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义

论著|基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义

时间:2019-12-14 05:42:49

相关推荐

论著|基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义

欢迎投稿

基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义

Expression and clinical significance of centromere protein A in pancreatic cancer based on GEO and TCGA >

向晓辉 毛骏 李海

天津市西青医院消化内科;武警后勤学院研究生队;天津市肝脏胰腺纤维化与分子诊疗重点实验室

通信作者:向晓辉,Email: xiaohuixiang@

【摘要】 目的探讨着丝粒蛋白A(CENP-A)基因在胰腺癌中的表达、临床意义及其在胰腺癌发生发展中的作用。方法分别从高通量基因表达(GEO)数据库的1个包含45例胰腺癌患者微阵列数据集(GSE28735)和癌症基因组图谱(TCGA)数据库的1个包含177例胰腺癌患者数据集获得CENP-A mRNA表达谱和临床病理资料。采用生物信息学方法分析CENP-A在胰腺癌组织表达与临床病理指标的相关性以及对患者预后的影响。采用基因集富集分析(GESA)预测CENP-A在胰腺癌发生发展中调控的可能通路,同时结合STRING数据库中CENP-A蛋白质-蛋白质相关作用网络(PPI)筛选出与CENP-A相关的蛋白,并分析两者表达的相关性。结果胰腺癌组织CENP-A mRNA的表达量显着高于癌旁组织,差异有统计学意义(4.492±0.361比3.431±0.405,P=0.001)。胰腺癌组织CENP-A表达水平与肿瘤TNM分期和分级显着相关(P<0.05)。CENP-A高表达患者总体生存期显着低于CENP-A低表达患者(P<0.05)。CENP-A高表达的胰腺癌组织存在细胞周期和DNA复制两条通路基因集的富集(P<0.01,错误发现率<0.05)。通过PPI网络分析发现胰腺癌组织CENP-A与周期蛋白依赖性激酶1(CDK1)、纺锤体检测蛋白1(BUB1)呈显着相关(r值分别为0.861、0.825,P值均<0.001)。结论胰腺癌组织CENP-A基因高表达与其恶性生物学行为有关,其机制可能是通过与CDK1、BUB1的协同作用实现。

【关键词】胰腺肿瘤;计算生物学;着丝粒蛋白质;生物学标记

全文刊载于

《中华胰腺病杂志》

第20卷 第3期 184-189页

PDF全文请点击下方“阅读原文”

全文阅读

胰腺癌是一种恶性程度很高、诊断和治疗都很困难的消化腺恶性肿瘤,起病隐匿,早期症状不典型,出现症状时大多已属中晚期,预后差。着丝粒蛋白(centromere protein,CENP)是一组形成、介导着丝粒功能的蛋白,最早被发现的是CENP-A,由CENP-A基因编码。CENP-A是一种组蛋白H3变体,对于着丝粒的组装形成、染色体的正确分离以及细胞分裂的正常进行起到了不可替代的作用。CENP-A在正常细胞中的转录、翻译水平受严格调控,对确保有丝分裂过程中基因组的稳定性发挥重要作用。研究发现CENP-A基因在多种恶性肿瘤中过表达,导致染色体非整倍体形成,而染色体非整倍体形成往往是肿瘤形成的重要原因之一。本研究通过检索高通量基因表达(Gene Expression Omnibus,GEO)数据库和癌症基因组图集(The Cancer Genome Atlas,TCGA)数据库,探讨CENP-A在胰腺癌组织中的表达及其临床意义。

资料与方法

一、数据来源

自GEO数据库(http:www.ncbi.nlm.nih.gov/geo)的1个微阵列数据集(GSE28735)下载45例具有完整临床随访信息的胰腺癌患者癌组织和癌旁组织mRNA表达谱数据;自TCGA数据库(https://cancergenome.nih.gov/)下载178例胰腺癌患者癌组织的mRNA Seq数据,其中177例患者具有匹配的mRNA表达谱、生存数据和完整的临床病理数据。

二、数据处理与患者分组

下载edge R软件包(/packages/release/bioc/html/edgeR.html)对mRNA表达谱进行过滤、归一化处理,并经log2转换后用于后续分析。基于TCGA数据库中177例胰腺癌样本CENP-A mRNA表达谱和随访数据,对样本的表达量进行由高到低排序后,取中位数将其分为高表达、低表达2组。

三、CENP-A基因功能富集分析

使用基因集富集分析(gene set enrichment analysis,GSEA)软件分析CENP-A mRNA表达水平与京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路基因集的相关性。设置随机组合次数为1 000次,计算标准化的富集系数(normallized enrichment score,NES),以标准化P值<0.01,且错误发现率(false discovery rates,FDR)<0.05为显着性富集。

四、CENP-A相关蛋白的筛选及相关性分析

STRING(Search Tool for the Retrieval of Interacting genes/proteins)数据库(https://string-/cgi/input.pl)是一个研究分析蛋白之间相互作用的在线检索生物数据库,可用于寻找与CENP-A蛋白作用密切相关的多个蛋白,构建蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络。将STRING数据库分析结果中的蛋白和本研究中的GSEA富集通路结果结合,筛选出与CENP-A相关的蛋白,分析两者表达的相关性。

五、统计学处理

癌组织与癌旁组织表达量比较采用配对样本t检验,临床病理指标参数采用独立样本t检验。生存分析采用Kaplan-Meier法及Log-rank检验。对CENP-A表达与相关蛋白表达进行Spearman相关性分析,并用GraphPad Prism 8.0软件对数据进行可视化处理。P<0.05为差异有统计学意义。

结 果

一、CENP-A在胰腺癌组织和癌旁组织中的差异表达

GEO数据库下载的45例胰腺癌组织和相匹配的癌旁组织中CENP-A mRNA表达量分别为4.492±0.361和3.431±0.405,胰腺癌组织CENP-A mRNA表达量显着高于癌旁组织,差异有统计学意义(t=14.531,P=0.001,图1)。

二、胰腺癌组织CENP-A表达量与肿瘤临床病理参数的关系

TCGA数据库下载的177例胰腺癌组织CENP-A基因表达量与TNM分期、肿瘤分级密切相关,差异有统计学意义(P值分别为0.035、0.007),而与患者年龄、性别、饮酒史及肿瘤家族史均无明显相关性(表1)。

三、CENP-A表达与胰腺癌患者预后的相关性

CENP-A的表达水平与胰腺癌患者总体生存期显着相关(P=0.001),高表达患者与低表达患者的生存率分别为36.4%和59.6%,中位生存期分别为511 d和913 d,高表达患者总体生存时间显着短于低表达患者,提示CENP-A基因高表达是胰腺癌患者预后不良的因素(图2)。

四、CENP-A基因功能富集分析

CENP-A高表达组织样本富集到细胞周期(P<0.001,FDR=0.004)与DNA周期(P<0.001,FDR=0.043)两个相关基因集,提示CENP-A可能通过上述两条通路发挥促进肿瘤发生发展的作用(图3)。

五、与CENP-A密切相关的蛋白分析

使用STRING数据库分析构建CENP-A蛋白的PPI网络,发现周期蛋白依赖性激酶1(cyclin-dependent protein kinase, CDK1)、纺锤体检测蛋白1(budding uninhibited by benzimidazoles 1, BUB1)、细胞周期调节激酶(aurora kinase A, AURKA)、AURKB等多个蛋白与CENP-A相互作用(图4),结合GSEA富集的细胞周期与DNA复制相关通路结果筛选出CDK1和BUB1两个关键蛋白。应用Spearman相关性分析显示胰腺癌组织CENP-A与CDK1、BUB1呈显着相关性(r值分别为0.861、0.825,P值均<0.001,图5)。

讨 论

着丝粒是真核生物细胞在进行有丝分裂和减数分裂时染色体分离的调控装置,由DNA和蛋白质组成。CENP-A作为着丝点的标志性蛋白因子,在染色体精确分离过程中发挥着关键作用。CENP-A功能失常将导致细胞分裂过程中发生染色体分离异常。在DNA复制过程中,染色质可通过回收修饰旧的组蛋白和沉积新的组蛋白而重新组装。Nye等研究发现,在肿瘤细胞中CENP-A的异常定位可以募集着丝粒组件,并与G1期的有丝分裂缺陷和DNA损伤相关。Takada等的研究结果揭示了通过CENP-A介导的着丝粒功能障碍,被激活的细胞周期蛋白E1/CDK2促进细胞染色体不稳定性和肿瘤的进展。

近年来研究发现,CENP-A在多种恶性肿瘤中过表达,其过表达与肿瘤的发生、发展、侵袭、转移及预后等密切相关。最近一项基于生物信息学的研究显示CENP-A在淋巴瘤、平滑肌肉瘤、胶质母细胞瘤、鳞状上皮细胞肺癌、小细胞肺癌、髓样乳腺癌、乳腺导管癌、胃肠型腺癌、食管鳞状细胞癌、肝细胞癌、胰腺癌、口咽癌、结肠癌、直肠癌、宫颈癌、卵巢浆液性囊腺癌、前列腺癌等20种不同类型的实体癌中表达升高。越来越多的研究表明,CENP-A具有作为肿瘤诊断标志物和预后指标的潜在应用价值。CENP-A是雌激素受体阳性乳腺癌复发的预后标志物,CENP-A表达增加可能导致乳腺癌患者的无病生存期缩短。口腔鳞状细胞癌组织中CENP-A蛋白和mRNA的表达明显高于正常组织,其表达水平与肿瘤大小、淋巴结转移有关,可能成为口腔鳞状细胞癌发生、发展的生物标志物。CENP-A在11种主要的人原发性结直肠癌组织中均过表达。CENP-A mRNA表达也上调,表明CENP-A的过表达发生在转录水平,可能在结直肠癌的非整倍体形成中起重要作用。

本研究借助GEO数据库CENP-A基因表达谱证实胰腺癌组织CENP-A mRNA表达量较癌旁正常胰腺组织上调,表明CENP-A基因具备作为胰腺癌病理诊断标志物的潜在价值。本研究基于TCGA数据库177例胰腺癌患者的CENP-A mRNA表达谱和临床数据进一步分析CENP-A表达量与胰腺癌临床病理指标及预后的相关性,发现CENP-A表达水平与肿瘤分期和分级密切相关,与患者生存时间呈负相关,提示CENP-A基因有望成为胰腺癌患者预后判断的新型分子标志物,并将有助于胰腺癌患者术后复发监测策略的完善。借助基因集富集分析发现CENP-A高表达组显着富集于细胞周期和DNA复制两条KEGG通路,进一步结合与CENP-A相关蛋白的分析结果推测,CENP-A可能是通过与之相关的CDK1和BUB1协同在胰腺癌组织中发挥其生物学作用。

虽然本研究为深入探讨CENP-A在胰腺癌中的作用提供了线索和依据,但尚未明确CENP-A参与胰腺癌发生发展的具体作用机制和途径,由于肿瘤的发生发展过程中存在多基因协同的复杂调控作用,因此其在胰腺癌形成过程中发挥的功能还有待后续实验予以进一步阐明及丰富。

微信号:CJP-2001

长按二维码关注我们

《中华胰腺病杂志》

如果觉得《论著|基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。