论文部分内容阅读
一、研究背景过去的几年中,液体活检作为最具有代表性的精准医疗诊断技术越来越多应用于癌症的早期诊断,预后预测,复发风险评估,连续采样进行疾病进展监测和治疗反应评估等方向。液体活检技术同传统的组织活检技术相比具有无创性、均质化及连续采样等优势。目前液体活检技术主要基于外周血中的循环肿瘤细胞(circulating tumour cells,CTCs)、循环细胞游离 DNA(circulating cell-free DNA,cfDNA)及ctDNA等,其中临床应用较多的主要是检测ctDNA中的拷贝数变异(copy number variations,CNVs)、基因突变及甲基化模式。但只利用ctDNA仍有部分患者通过以上检测技术无法获得有效信息。cfDNA主要来自于凋亡细胞,因被核小体保护而未被降解。基因组的核小体印记与基因转录及基因表达水平密切相关,转录起始位点(Transcription start sites,TSSs)附近区域核小体的结合明显减少。而基于组织活检的基因表达技术已在乳腺癌临床治疗中有广泛的应用,如Oncotype DX 21基因检测、Mamma Print 70 基因检测、EndoPredict 11 基因检测、Prosigna PAM50 基因检测及 Breast Cancer Index(BCI)11基因检测。因此利用血浆中cfDNA的全基因组测序,分析TSSs区域覆盖度差异,对乳腺肿瘤的良恶性区分、分子分型、淋巴结转移及新辅助化疗疗效预测进行研究,为乳腺癌的无创检测及后续治疗提供更为广阔和可靠的数据来源,具有更大的前景。二、研究目的利用血浆中cfDNA全基因组测序,分析TSSs区域覆盖度预测基因表达,基于该技术建立无创的分类方法,对乳腺肿瘤的良恶性区分、分子分型、淋巴结转移及新辅助化疗疗效预测进行研究,为乳腺癌的治疗提供可靠的数据来源。三、研究方法第一章我们利用两株乳腺癌细胞系MDA-MB-231和T-47D以及50例乳腺癌患者血浆进行cfDNA分布特征与基因表达之间的相关关系研究。该部分我们从以下3个方面进行研究:1.细胞上清液cfDNA分布特征与细胞沉淀的核小体定位的相关关系;2.细胞上清液cfDNA分布特征与细胞内基因表达的相关关系;3.乳腺癌患者血浆cfDNA分布特征与乳腺癌细胞系基因表达之间的相关性,是否为乳腺癌特异性的。为了确定以上关系,我们首先统计细胞上清液和乳腺癌患者cfDNA的转录起始位点TSSs±1k bp区域覆盖度,细胞内核小体测序的TSSs±1kbp区域覆盖度,筛选细胞内的差异表达基因及TCGA数据库中乳腺癌高表达基因,随后使用Spearman秩相关分析和置换检验(Permutation tests)对每两组进行相关关系进行研究。第二章我们进行了 cfDNA分布特征在乳腺癌诊断、分型及淋巴结转移预测的临床应用研究。首先我们对整体、局部染色质变量、及TSS±1k bp区域进行评估,即通过以下三个不同层面:5-Mb精度窗口、染色体不同功能区域、线粒体基因组拷贝数和TSSs±1kbp区域覆盖度。最终确定使用TSSs±1kbp区域覆盖度,基于logistic回归模型(logistic regression model),开发分别针对乳腺肿瘤良恶性区分(乳腺良性肿瘤197例,乳腺癌263例)、分子分型(Luminal A 41例,Luminal B 82例,Her2 26例,三阴型24例)和淋巴结转移预测(淋巴结转移53例,淋巴结未转移51例)的分类器,并通过ROC曲线评价所建立的分类器的效果。第三章我们进行了 cfDNA分布特征与乳腺癌新辅助化疗疗效关系的探讨。我们首先对收取的两组共22例(12例应答者和10例非应答者)经新辅助化疗8个化疗周期的患者在化疗前,化疗初期(1个化疗周期后),化疗中期(3或4个化疗周期后)和化疗末期(8个化疗周期后)的血浆样本,进行cfDNA分布特征分析,对两组随化疗周期的分布特征变化的基因进行差异分析和无监督聚类分析,最后进行相关的基因功能分析。随后我们尝试只分析38例(28例应答者和10例非应答者)新辅助化疗患者化疗前的血浆样本cfDNA分布特征差异,探讨在化疗前疗效预测的可行性。四、研究结果第一章中Spearman秩相关分析细胞上清液cfDNA分布特征与细胞沉淀的核小体定位图谱呈正相关,与细胞内基因表达呈负相关。置换检验(Permutation tests)评估细胞上清液 cfDNA 的 HTSSs(high coverage depth around TSSs)或LTSSs(low coverage depth around TSSs)与细胞核小体 DNA 的 HTSSs 或 LTSSs之间的overlaps(p<1e-22)都是显著富集的,细胞上清液的cfDNA的LTSSs与细胞内 HEGs 之间 overlaps(T-47D:p=9.116e-06;MDA-MB-231:p=1.981 e-05)和HTSSs 与细胞内 LEGs 之间 overlaps(T-47D:p=2.987e-06;MDA-MB-231:p=3.156e-10)具有较显著的富集。乳腺癌患者比健康人群cfDNA的TSSs周围-1k bp到+1kbp区域覆盖度低的基因与TCGA数据库中癌组织比癌旁组织高表达基因的overlaps有显著富集(p=0.014)。第二章中对cfDNA的整体、局部染色质和TSS±1 kb片段进行研究,发现cfDNA的TSSs±1k bp区域覆盖度最适合建立PPCET分类器;所建立的乳腺肿瘤良恶性区分、分子分型和淋巴结转移预测的分类器的准确性,特异性等均达到80%左右。第三章中通过新辅助化疗的系列血浆标本与疗效的相关关系的研究,结果发现相对于非应答者,应答者中有321个基因TSSs区域覆盖度因化疗而发生了变化,其中在化疗初期发生变化的基因有205个,93个基因TSSs区域覆盖度降低,112个基因TSSs区域覆盖度升高。到化疗中期发生变化的基因有116个,66个基因TSSs周围覆盖度降低,50个基因TSSs周围覆盖度升高。这321个基因随着化疗结束TSSs区域覆盖度趋于稳定,基因功能分析显示这些基因主要与对DNA损伤的应答、抑制细胞增殖及免疫应答相关;只分析化疗前乳腺癌血浆标本的cfDNA分布特征,应答者和非应答者间共有232个TSSs区域覆盖度差异显著的基因:100个基因TSSs区域在应答者中高覆盖,132个基因TSSs区域在非应答者中高覆盖。五、研究结论1.cfDNA分布特征与细胞内核小体足迹图谱呈正相关,与细胞内基因表达呈负相关;2.通过TCGA数据库分析乳腺癌患者cfDNA分布特征是乳腺癌特异性的;3.通过cfDNA的TSSs±1k bp 区域相对覆盖度对乳腺癌诊断、分子分型及淋巴结预测做了3个分类器,能够较好地把每个分组不同类别分开,为乳腺癌的非侵入性诊断提供了一种可行的“液体活检”方案;4.通过新辅助化疗的系列血浆标本与疗效的相关关系的研究,应答者化疗后发生改变的基因主要与抑制细胞增殖、对DNA损伤的应答和免疫应答相关;5.只分析新辅助化疗前的乳腺癌血浆标本cfDNA分布特征,发现应答者与非应答者存在差异,这有望在化疗前就开发用于预测乳腺癌化疗疗效的新生物标志物,最终实现无创预测。