糖尿病康复,内容丰富有趣,生活中的好帮手!
糖尿病康复 > 生物信息学:肿瘤标志物的研究进展

生物信息学:肿瘤标志物的研究进展

时间:2024-04-19 22:03:42

相关推荐

生物信息学:肿瘤标志物的研究进展

生物信息学

生物信息学(bioinformatics)是生命科学、计算机科学、信息科学和数学等学科交汇融合所形成的一门交叉学科。它通过对分子生物学实验数据的获取、加工、存储、检索与分析,达到揭示这些数据所蕴含的生物学意义的目的。随着人类基因组计划(human genome project,HGP)的完成,生物信息学已经成为当今生命科学和自然科学的核心领域和较具活力的前沿领域之一。

生物信息学应用数理和信息科学的理论和方法研究生命现象与生命的本质,并组织和分析日益剧增的生物信息数据库。人类基因组计划的顺利实施与完成,产生了大量的生物分子数据。与数据挖掘类似,生物信息学主要利用计算机、网络技术和大量数学工具,从海量数据中提取有用的生物学信息。

对逐日增多的脱氧核糖核酸(deoxyribonucleic acid,DNA)及其编码的蛋白质等序列和结构进行收集、整理,并从中分析和发现新的序列,从而不断揭示人体生理和病理过程的分子基础,为人类疾病的预防、诊断和治疗提供根本依据,在人类疾病与功能基因的发现与识别、基因与蛋白质的表达与功能研究方面都发挥着关键的作用。生物信息学技术在基于基因与蛋白质功能缺陷的合理化药物设计方面也有着巨大的潜力。

随着人类基因组计划的不断发展,生物信息学的研究范围已从结构基因组学扩展到功能基因组学,随之又出现了进化基因组学。生物信息学的根本任务之一是发现新的基因、蛋白及其功能,其研究的重点主要体现在基因组学(genomics)和蛋白质组学(proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。在短短的几十年中,已经形成了许多研究方向。

(1)序列比对(sequence alignment)。

(2)蛋白质结构预测。

(3)基因识别、非编码区分析研究。

(4)分子进化和比较基因组学。

(5)遗传密码的起源。

(6)基因表达谱分析、代谢网络分析、基因芯片设计与基因芯片数据分析等。

(7)癌症生物信息学等。

这些领域逐渐成为生物信息学中新兴的重要研究领域。随着生物信息学的快速发展,它必将解释生物分子信息的本质,使人类更好地了解、掌握遗传信息的编码、传递及表达,从而加快人类了解自身的过程。

癌症及标志物简介

癌症是一种复杂的疾病,普遍发生在人体的许多组织中,癌症的发生、发展过程中伴随出现了基因组中非常多的变化和许多基因的突变。癌症是一组复杂的疾病的统称,其中包含许多相关环境的改变和基因组的突变。这些变化对组织中的异常细胞的生长起到了重要的作用。

癌症是世界各地导致人类死亡的主要原因之一。根据《世界癌症报告》,大约有1400万新发病例,癌症相关原因导致死亡的人数超过800万,如果没有有效的预测和治疗癌症的手段,每年新增和死亡的癌症病人数将继续上升。预计在未来,新发病例人数将上升至2200万。

据《中国肿瘤登记年报》调查显示,全国每年新发肿瘤病例约为312万例,每年因肿瘤死亡的病例约为270万例。从近30年的登记数据来看,中国城乡居民的肿瘤发病人数和死亡人数均呈现逐渐上升的趋势,目前,肿瘤已经成为中国城市居民的首位死因和农村居民的第二位死因。虽然中国的肿瘤发病率低于发达国家,但死亡率却远远高于发达国家。

根据世界卫生组织的数据显示,全世界肿瘤新发病人中 20%出现在中国,而中国肿瘤死亡病人却占了世界的 25%。在发达国家的肿瘤死亡率已经下降到 40%左右的情况下,中国肿瘤的死亡率仍高达 80%以上。其原因在于,中国对肿瘤的防控能力非常低,大部分患者在确诊时已到了中晚期,而肿瘤早期发现时治愈率可达65%。因此,寻找有效的肿瘤早期诊断方法和途径对于降低肿瘤的死亡率具有重要的意义。

早期诊断对于癌症病人至关重要。在癌症的发展过程中,一些与遗传突变或表观遗传改变相关联的基因或蛋白质,在癌症组织或有炎症的组织同正常组织对比的过程中可以被检测出来。这些基因或蛋白质可以对癌症的严重程度进行定量测量,从而对癌症的发现和检测提供非常重要的工具。

肿瘤早期诊断对于肿瘤控制和预防至关重要,而肿瘤早期诊断的主要难点在于大多数肿瘤在早期阶段并没有明显的特异性症状。尽管一些先进的诊断方法,如早期胸部肿瘤X射线透视法、临床活检等方式对肿瘤的诊断能力有了一定的提高,但还达不到所需的早期肿瘤发现的灵敏度和特异度。在许多情况下,只有在肿瘤细胞转移到周围组织或者全身恶化情况下肿瘤才能被诊断。

此时,由于传统的治疗方法对于大多数病人无能为力,所以肿瘤早期诊断,甚至在原位癌阶段进行诊断对于提高肿瘤治愈率具有重要的意义。因此,寻找一种更加有效的肿瘤早期诊断技术对于人类的健康和社会的发展具有重要的意义。

肿瘤标志物是指存在于恶性肿瘤细胞或由恶性肿瘤细胞产生的物质,或者患者对肿瘤的反应而产生的分子。这些分子主要包括:mRNA、microRNA(以下简称为miRNA)、蛋白质、多肽(peptides)以及代谢小分子。这些分子广泛地存在于肿瘤细胞和组织中,也可进入血液、尿液或唾液等体液中。

随着基因组、转录组、蛋白质组和代谢组等技术的发展,各国科学家发现了众多与肿瘤发生、发展相关的各种基因标志物、miRNA标志物、蛋白质标志物和代谢小分子标志物。不断扩充的肿瘤标志物信息无疑给肿瘤的早期诊断带来希望的曙光,并且对研究肿瘤发生、发展的机理具有重要作用。

肿瘤标志物研究现状

迄今为止,研究人员发现了许多用于早期诊断的肿瘤分子标志物,如诊断前列腺癌的前列腺特异抗原(prostate specific antigen,PSA)、诊断肝癌的甲胎蛋白(alpha fetoprotein,AFP)和诊断胃癌的人分层蛋白(stratifin,SFN)等。然而,其中大多数标志物都是从实验中得到的,在标志物筛查过程中需要耗费大量的时间、人力与物力。

近年来,许多研究者通过计算的方法利用基因的转录组数据来识别标志物。其中大多数方法利用有监督或无监督的计算方法选择一系列基因作为肿瘤标志物,这些标志物能够区分正常样本和肿瘤样本。

随着基因表达数据的增加,Hsu等提出了一种无监督动态层次自组织算法,在表达数据上识别肿瘤基因标志物。Liu等开发了融合遗传算法和支持向量机的混合方法,以分类癌症和识别标志物。Beattie等提出了一个二进制状态模式聚类模型来确定肿瘤标志物。Harris等提出了一个半监督遗传学习模型,在基因表达数据中自动识别肿瘤标志物。Abeel等提出了一个基于线性支持向量机和反向剔除方法的总体特征选择算法以识别肿瘤标志物。

近年来,一些肿瘤标志物识别方法在使用表达数据的基础上还加入了先验知识或生物学过程。Gormley等提出了一种有监督特征选择算法,该算法将临床信息和已知的疾病相关基因结合使用。Chen等提出了一个知识指导的多尺度独立成分分析方法,在推断调控信号之后,通过基因芯片数据识别生物学相关的标志物。Yousef等提出了一个基于基因表达数据和生物网络信息的模型,以分类癌症和识别相应的标志物。

随着高通量技术的发展,miRNA转录数据也被广泛应用到肿瘤标志物预测研究中。Gao等通过实验比较了原发性肺鳞状细胞癌(primary squamous cell lung carcinoma)及其对应的对照样本,研究其病理学机理和患者术后的生存时间等。通过比较分析,7个miRNA在癌症样本中高表达,21个miRNA低表达,而miR-21的高表达与患者生存时间缩短有关系,有望成为预后诊断的分子标志物。Tsz-Fung等在肾癌亚型病人的肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)中识别了33个差异表达的miRNA,相关分析表明这些miRNA与癌症发病机理关系密切,可能成为潜在的标志物。

Wen等发表了对肝癌血液miRNA早期诊断标志物的识别工作,检测到了8个高表达的miRNA,进一步对4个miRNA(miR-20a-5p、miR-320a、miR-324-3p和miR-375)进行研究,相关结果表明它们可以作为临床检测肝癌早期诊断的miRNA标志物。Jiang等通过对106个食道癌样本和60个正常样本的比较分析发现血液miR-218在食道癌病人中是低表达的,它与癌症的分化、分阶段以及淋巴结转移等有关,可以作为食道癌早期诊断和临床验证的潜在血液标志物,有待进一步研究。

近年来,国内肿瘤标志物预测以及相应的发生、发展机制研究也取得了一定的成果,相关的报道和论文逐渐增多。

上海生物信息技术研究中心李亦学研究员的研究团队在收集已有肿瘤相关蛋白质组学数据的基础上,开发了人类蛋白质差异表达数据库dbDEPC。利用该数据库可以得到多种肿瘤相应的差异表达蛋白,从而推断潜在的肿瘤诊断标志物。他们还在序列信息和miRNA与mRNA表达数据的基础上,构建转移性肝癌和非转移性肝癌的组合调控网络。网络中包含转录因子和miRNA,其中的基因和miRNA可以作为潜在的肝癌诊断标志物。

清华大学孙之荣教授的研究团队在基因组和转录组数据的基础上,利用网络分析的方法挖掘肿瘤发展中具有突变和表达差异变化的核心模块,模块中的基因可以作为候选的肿瘤诊断标志物。他们还在结直肠癌的基因表达数据基础上,识别表达显著变化的多基因功能模块,利用这些基因模块可以诊断结直肠癌的复发概率。

中国科学院系统生物学重点实验室陈洛南研究团队使用动态网络生物标志物(dynamical network biomarkers,DNB)对包括癌症在内的复杂疾病进行早期诊断,并通过实验验证了该方法的有效性。

哈尔滨医科大学李霞教授团队对癌症等疾病的miRNA及基因的子通路进行了研究,不仅对相关疾病中miRNA和子通路的关系进行了阐述,还揭示了miRNA的调控机制和癌症等复杂疾病的发病机理。

中山大学马俊教授等对鼻咽癌患者的miRNA表达情况进行了研究,得到5个可以作为预后诊断的miRNA标志物。复旦大学朱虹光教授等利用分类算法来建立大肠癌早期诊断的数学模型,找到了14个miRNA的组合,该组合区分腺瘤和大肠癌的准确率达94.1%。

然而,目前已有的肿瘤标志物及其预测方法还存在着一些问题亟待解决。

(1)目前研究的肿瘤标志物绝大部分都是肿瘤相关性而非特异性的,在选取肿瘤标志物时,需要排除其他疾病和肿瘤的干扰,从而提高肿瘤筛查的有效性。

(2)在众多肿瘤标志物预测研究中,只有很少的研究考虑了这些标志物与肿瘤的分期、分型和生存率等恶性程度的相关性。

(3)已有的大多数肿瘤标志物预测方法只是利用相应的转录组数据预测在肿瘤组织中具有转录差异的基因或miRNA,而很少考虑这些分子是否存在于血液、尿液或者唾液等体液中。

如果觉得《生物信息学:肿瘤标志物的研究进展》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。