癌症是基因病,是由细胞内关键癌基因的获得性突变引起的疾病。这些突变改变了细胞生长调控的路径,并与组织环境相互作用。
此前,对癌基因的研究主要集中在蛋白质编码基因,但这只占所有基因的1%。为了探索剩余的99%基因组,国际癌症基因组协会/癌症基因组图谱计划(ICGC/TCGA) 组织了全基因组泛癌分析(PCAWG)项目,对38个癌种,超2600例原发癌症和它们对应的正常组织进行全基因组测序和综合分析,以期为人类解锁盛大的癌症全基因组“密码”。全部内容发表于《自然》及其子刊。
文章一经发出,《自然》官网上也进行了大篇幅的报道,其标题更是用“unprecedented scale”(前所未有的)来形容这次的全球基因组项目。那么这个项目到底有何发现?请随笔者一起看看吧!
1
从1%到100%,研究得出如下4大发现
“14年前,基因组研究团队测出了第一个与癌症相关的外显子,在后来的10年间,共测出了近2万个癌症外显子。但是,这只是全部基因组的1%。这就像你想把10万个拼图组件放在一起,但却丢失了99%一样。“项目指导委员会成员和加拿大Ontario癌症研究中心Lincolin D. Stein教授在媒体发布会上说道。
因此,PCAWG项目统一分析了38个癌种的2658个全癌症基因组信息。没错,是全部100%的癌症基因组。
基于发现,研究组共发表了23篇文章于《自然》和其子刊上,其中有6篇核心文章发表于《自然》主刊。“这6篇文章可以说是肿瘤云基因学的里程碑。PCAWG海量且高质量的数据极大地推进了生物学及方法学的发展。”Marcin Cieslik和Arul M. Chinnaiyan教授在评述中写道。
简而概之,研究主要有如下4大发现:
平均每个癌症基因组内有4-5个驱动突变,5%的癌症没有驱动基因突变;
大多数驱动突变是在基因组的编码区;
“分子时钟”能够决定在癌症进化过程中的突变顺序;
不同模式的基因突变可以帮助定义肿瘤类型,如一些无明确原发部位的肿瘤。
2
每个癌症基因组均携带4-5个驱动突变
在全癌症分析中,汇聚了来自于2605例原发肿瘤和173例转移或局部复发的2658个癌症基因组及对应的正常组织。这些突变分为3类:体细胞单核酸突变(SNVs)、小嵌入和删除(indels)、复制数量改变和结构变异(SVs)。
这些突变一共包含>4300万体细胞SNVs,>40万体细胞多核酸变异,>240万体细胞删除,接近29万体细胞SVs,>1.9万体细胞后移位事件,以及>8000新线粒体DNA突变。这些突变根据肿瘤突变负荷和肿瘤种类的不同而有异质性。很多癌症中还存在复杂的染色体重排(17.8%)和染色体碎裂(22.3%)。
研究发现,91%的癌种至少有1中可鉴别的驱动突变,平均为4.6个/癌种。约5%的癌种没有驱动突变。
例如,乳腺癌和卵巢腺癌中,SVs是最常见的突变类型。结直肠腺癌和成熟B细胞淋巴瘤中驱动点突变发生率比较高。与抑癌基因有关的驱动突变中,最常见的是TP53,这2个等位基因都存在突变。
在大多数嫌色性肾细胞癌和胰腺神经内分泌肿瘤患者中没有找到驱动突变。“也许全染色体的增减组合可能足够启动这些癌症发生。”研究者解释说。
在发布会上,来自PCAWG指导委员会和英国WellcomeSanger研究所的Perter Campbell教授谈到了研究的意义:“当治疗患者的时候我们会发现,2个患有相同癌症,获得相同治疗的患者,其预后完全相反,一个死亡,另一个存活。而这个答案就写在基因之中。每个人的癌症基因组都与其他人不同,里面有成千的不同致癌突变组合。”因此,了解这些突变模式和受影响的基因,能够帮助鉴别患者所患的肿瘤,尤其是占全部肿瘤5%的不明来源的肿瘤。
3
非编码区域的突变有新发现
《自然》官网说道,非编码区域的突变研究是一项“雄心勃勃的事业”(ambitious undertaking),因为相比于编码区,精确地探测非编码区的突变要难得多。
在“非编码体细胞突变”分析中,PCAWG的研究人员研究了原来报道过的非编码突变,例如非编码RNAs NEAT1和MALAT1,也提出了一些新发现。
例如,研究者发现了在TP53的5’区域的点突变、NFKBIZ(编码转录因子)和TOB1基因调解的关键点,与胃癌和乳腺癌相关)的3’非翻译区的点突变、BRD4的局部删除和AKR1C基因位点的重排。
但是,非编码突变毕竟只是少数。“我们会用更大的数据样本和先进的技术继续鉴别非编码驱动,尽管它比蛋白质编码驱动的发生频率少得多。”研究者评论道。“对于肿瘤患者而言,这意味着大多数临床相关的癌症突变更可能在蛋白质编码序列中,这样就简化了临床基因组测序的工作。“ PCAWG研究者Martincorena教授说。
4
分子时钟揭示突变发生的顺序
分子时钟也就是癌症突变的进化史。依据分子时钟的概念,可以将突变分为克隆性的(存在于所有癌症克隆中)或亚克隆性的(发生在一部分癌症克隆中),也就是在亚克隆之前已经发生了克隆事件。
在2583个样本的4700万点突变中,研究者发现,22%是早期克隆事件,7%是晚克隆,53%是非特异性克隆,17%为亚克隆。在一个453个癌症驱动基因的样本中,研究者鉴别了5813个致癌基因点突变,29%是早克隆,5%晚克隆,56%非特异性克隆,8%亚克隆。
KRAS、TP53和PIK3CA的驱动突变以及TERT的非编码区驱动突变是在肿瘤进化过程中的早期事件。此外,50%的早期驱动突变是在9个基因中,50%晚突变和亚克隆突变是在35个基因之中。
时序分析表明,环境对肿瘤进展的影响随着时间逐渐减弱,DNA修复缺陷的频率和严重性逐渐增加。值得注意的是,驱动基因的突变发生常常会比癌症的诊断早几年甚至几十年。
“分子时钟”的技术,能够让科学家分析出突变发生的顺序,可以用在癌症早期诊断和预防措施之中。“总体而言,研究揭示了不少驱动基因能够发生在癌症诊断之前的若干年中,这也就为早期诊断和生物标记物发展提供了可能。”Marcin Cieslik和Arul M. Chinnaiyan教授在评述中写道。
5
临床医生如何利用好这些信息宝库?
随着特定癌种的变化通路及基因的明确,临床医生能够更加精确地诊断患者肿瘤的变化,鉴别调控紊乱的通路,并且研究有效且低毒的治疗方案。“我们能够在未来不断开发靶向药物。”Stein教授在发布会上说。“全基因组项目提供了基因组收集和分析的指示图,我们建立了标准高质量的流程表以便允许不同的中心以统一和谐的方式分析数据。“
例如,KRAS-靶向药物能够治疗KRAS突变,但是有关KRAS蛋白-编码区或KRAS扩增和结构重排的一些信息提示,有这些缺陷的肿瘤能够用同一种药物治疗。
“在之前,我们只了解外显子测序,近三分之一的患者是处于黑暗之中的,我们没有信息能够进行精准治疗。”他说道。
尽管发表了如此重磅的研究,但研究者也提到了PCAWG项目的局限性。其中,该项目最大的缺点是缺少了与患者治疗预后相关的临床数据。
好在ICGC ARGO项目的官网宣布,研究组将启动ICGC-ARGO项目,并计划从临床试验中采集10万个癌症患者的数据,包括预后和基因组信息。
“如果我们收集了基因组数据与临床预后相结合的足够多数据,我们就可以开始构建机器学习模型和决策支持系统,帮助临床医生将患者的分子和基因学信息于治疗结局相匹配。”Stein教授说。
让我们一起期待,全癌症基因组测序能够真正造福肿瘤患者的那一天早日来临!
39健康网(www.39.net)专稿,未经书面授权请勿转载。
有人把西兰花叫做“天赐的良药”和“穷人的医生”,这是因为常吃西兰花有爽喉、开音、润肺、止咳的功效,长期食用还可以减少乳腺癌、直肠癌及胃癌等癌症的发病几率。