论文部分内容阅读
癌症是人类健康的重要威胁之一。据估计,仅在2015年一年中,中国有大约429万人被确诊患有癌症,同时,有大约281万人死于癌症。随着对癌症的深入研究,除了常规的放疗和化疗,针对不同癌症的靶向治疗和免疫治疗的治疗手段也在不断发展。然而,癌细胞具有极强的突变和适应能力。通过治疗,癌症虽然会出现一定程度的缓解,但是随后往往会出现复发和转移,使得癌症治疗更加困难。 癌症的发生、发展和转移/复发是一个动态的演化历程,而慢性淋巴系白血病(Chronic Lymphocytic Leukemia,CLL)则是一个很好的研究对象。CLL是一种最常见的血液系统恶性肿瘤,多起源于一群恶性增殖的B淋巴细胞。由于CLL的发展较缓慢,大部分CLL病人在确诊的前几年并不需要进行治疗。同时,抽血就可以获取癌细胞,可以实现对癌症的长期监控。随着测序成本的降低,研究人员对大量的癌症进行了全基因组测序以及RNA-seq测序。通过大规模的测序研究,研究人员发现多个与CLL相关的突变以及信号通路,并基于突变信息推断CLL的演化历程。然而,基于单个或少量时间点的组织样本的测序信息,并不能准确的回溯癌症的演化历程。因此,本论文针对以上问题,以一例CLL病人为研究对象,对多个时间点的癌症样本进行组织水平和/或单细胞水平的测序分析,重构出这例CLL的演化历程,揭示了CLL发展过程中重要突变。论文的具体研究内容为: 1.研究对象为一例有29年跟踪历史的CLL,选取其确诊后第8年至第28年间的16个时间点的冻存血液样本,通过流式细胞荧光分析仪进行分选,获得癌细胞。对不同时间点的癌症样本进行组织水平的全基因组测序、芯片测序、单细胞低深度全基因组测序以及单细胞转录组测序,获得合格的测序原始数据。 2.对组织水平的全基因组测序和芯片测序结果进行分析,获得第8年至第28年间癌症样本中的拷贝数变异信息(Copy Number Variations,CNVs)。结合病人的治疗信息以及单细胞全基因测序结果可知,在治疗前,CLL主要以染色体13q14缺失、6q缺失和12q增加为主。随着治疗的进行,这些CNVs逐渐消失,取而代之的是另一个带有12号染色体三倍型和10p中性杂合性缺失的细胞克隆,并一直维持到第28年。同时,通过全基因组测序结果,在已知的CLL的重要基因MYD88上检测到非同义突变。 3.对其中5个时间点共300个单细胞RNA-seq数据进行分析,发现多个与干细胞调控相关的转录调控因子的异常表达,包括FOS,JUN和KLF4等基因。在进行第二次治疗后,癌细胞呈现出另外一种完全不同的表达模式,而且细胞之间的差异性更大。而在一段短暂的缓解期内,癌细胞则表现的与早期细胞相似。除此之外,伪时间演化分析也进一步揭示了癌症在发生、恶化、缓解和复发等不同阶段中基因表达水平的复杂变化。多个癌症相关的重要细胞通路,如B cell receptor通路、EGFR通路、ERKs通路和NF-kappa B通路等,都在CLL的发展历程中表现出表达水平的变化。