论文部分内容阅读
目的:过去10年中,免疫治疗似乎成为了攻克头颈部鳞癌的新希望之一。目前针对头颈部鳞癌患者的免疫治疗方案的制定和疗效预测,主要依赖FDA推荐的免疫疗效生物学标志物,如PD-L1、错配修复功能缺陷(d MMR)或微卫星不稳定(MSI-H)等。但是这些单一的免疫疗效或预后生物学标志物预测头颈部鳞癌患者的免疫疗效的效能还需要进一步提升。随着二代测序技术的发展和计算机算力的提升,研究人员更倾向于通过更多组学信息描述头颈部鳞癌患者的免疫微环境特征,探索多维度的生物学标志物进而预测患者的免疫疗效和预后。本研究旨在通过生物信息学分析技术筛选影响头颈部鳞癌患者预后的重要生物学标志物,并构建新算法建立可以识别头颈部鳞癌患者免疫亚型的预测模型并描述其内在的生物学意义。研究方法:一、基于多组学筛选头颈部鳞癌预后信号通路及构建免疫亚型预测模型1、本研究通过多组学预后分析,筛选影响头颈部鳞癌预后的重要信号通路和生物学标志物。研究方法如下:1)下载TCGA中头颈部鳞癌多组学数据(包括:转录组数据、基因突变数据、基因拷贝数变化数据和基因甲基化数据)和临床相关数据。转录组学数据为TCGA Level3 Counts,通过公式标准化为TPM数据,删除表达量为0的比例大于20%,或表达量中位值为0的基因,基因类型根据Vega的标准进行注释;甲基化数据使用VEP软件对体细胞突变位点进行注释;拷贝数变化数据,数据通过GISTIC2软件根据CNV来评估基因的变化情况。所有数据均进行归一化、标准化处理。2)通过MOSClip多组学分析筛选影响头颈部鳞癌预后的信号通路及生物学标志物。3)通过Reactome数据库进行注释细胞生物学功能。4)回顾性收集本医院头颈部鳞癌患者的临床病理学参数,随访获得患者的生存相关数据。5)利用免疫组织化学染色验证头颈部鳞癌患者肿瘤组织中IL2RG的表达情况。6)通过甲基化特异PCR实验(MSP)验证头颈部鳞癌患者肿瘤组织中LCK甲基化水平。2、利用白细胞介素2(IL-2)相关基因构建预测免疫亚型的数学模型,研究方法如下:1)通过1000次Lasso-Logistic分析筛选免疫亚型相关重要基因。2)通过单因素和多因素Cox回归模型筛选头颈部鳞癌预后相关基因。3)通过R包Consensus Cluster Plus实现一致性无监督聚类分析。4)采用单样本基因富集分析评价肿瘤相关信号通路及肿瘤免疫细胞的浸润丰度。5)通过Estimate算法评估头颈部鳞癌样本的肿瘤纯度。6)采用非负矩阵分解法和自重抽样算法构建头颈部鳞状细胞癌免疫亚型预测IRIM模型(IL2 Family Signaling pathway related immune subtypes model)。7)通过免疫疗效相关数据库(IMvigor210、GSE35640、GSE78220、GSE63557和GSE91061)验证IRIM模型与免疫分型及免疫疗效之间的关系。8)通过R语言编写代码实现IRIM模型的可视化,并且部署在shinyapps.io服务器上。二、IRIM模型在头颈部鳞癌肿瘤免疫分型中的生物学意义1)本研究分析采用头颈部鳞癌单细胞测序数据GSE103322,通过细胞质量评价删除了测序过程中产生的“双细胞”和低质量的细胞。2)通过Seurat包中的Normalize Data函数对基因的表达量进行标准化,数据的批间差校正通过harmony包完成。3)主成分分析采用HVGs算法,选取了前25个主成分进行t SNE和UMAP降维分析。通过DBClust Dimension函数删除了聚类细胞数少于30个的亚群。4)细胞类型注释通过两种形式:(1)通过Single R包进行注释;(2)通过各种类型基因的生物学标志物进行注释。5)通过Seurat包中的“Find Variable Genes”函数计算各个细胞亚群之间的差异基因。6)通过单细胞功能富集分析注释细胞亚群的生物学功能。7)运用R软件进行统计分析,服从正态分布的定量数据以均数±标准差来表示,组间比较采用T test检验,不服从正态分布的定量数据以中位数及四分位间距来表示,组间比较采用Wilcoxon检验。定量变量符合正态分布选择定量变量的平均数为截断值,定量变量不符合正态分布选择定量变量的中位数为截断值。采用Kaplan-Meier法生成各数据集中各亚组的生存曲线,采用Log-rank检验确定差异的统计显著性,对于生存曲线相交的数据采用Landmark分析。P<0.05认为差异具有显著的统计学意义。结果:1、利用多组学数据筛选头颈部鳞癌预后生物学标志物,研究纳入TCGA转录组数据、基因突变数据、甲基化数据和拷贝数变化数据。结果显示:共有45条通路与头颈部鳞癌患者的预后相关。这45条信号通路在头颈部鳞癌中主要在人体免疫功能方面发挥作用。2、分别按照预后相关通路和预后相关通路中的基因模块的P值进行排序、筛选。结果显示:Interleukin-2 family signaling信号通路及其基因共表达模块1与头颈部鳞癌预后关系最为密切。3、我们采用Kaplan-meier曲线对Interleukin-2 family signaling通路及其基因共表达模块1进行生存分析。结果显示:该信号通路中基因表达量较低且甲基化水平较高的头颈部鳞癌患者预后较好,差异有统计学意义。4、通过一致性聚类分析发现Interleukin-2 family signaling通路相关基因可以将头颈部鳞癌患者分为两个亚群。5、通过Wilcoxon检验分析发现,两个亚群中T细胞含量、B细胞含量、WNT通路评分、IFNG通路评分、PDL1表达均有统计学差异。基于既往研究两个亚群分别显示了免疫炎症型及非免疫炎症型的特征。6、为了验证Interleukin-2 family signaling相关基因在免疫分型中的作用,我们在IMvigor210数据集中进行验证。结果显示:IL21R、IL2RG、LCK、INPP5D、JAK3和PIK3R3的基因表达量可以区分免疫炎症型患者并且与患者免疫治疗疗效有关。7、为了更好的描述上述6个关键基因与免疫分型的关系,我们设计了IRIM算法,并且构建了头颈部鳞癌免疫亚型预测模型(IRIM模型)。结果显示:在头颈部鳞癌中上述6个关键基因中如果有3个或3个以上基因发挥作用,即可以认定该头颈部鳞癌患者为“免疫炎症型”,AUC为0.8146,准确率为74.3%。8、通过其他免疫治疗相关数据集(GSE35640、GSE78220、GSE63557和GSE91061)进行验证,结果表明IRIM模型在其他数据集中均可以提示免疫治疗疗效。9、通过Estimate及相关性分析发现,此6个关键基因均主要表达在肿瘤微环境中,所以我们猜测IRIM模型无肿瘤器官特异性,因此我们在不同癌种中进行了验证。结果显示:IRIM模型在肺鳞癌、乳腺癌、宫颈鳞癌、食管鳞癌等多数实体肿瘤中均可以识别“免疫炎症型”患者。10、为了验证此6个关键基因和Interleukin-2 family signaling信号通路与头颈部鳞癌患者预后的关系,我们通过主成分分析筛选出代表基因IL2RG和LCK。11、GEPIA数据库分析显示,IL2RG是头颈部鳞癌的预后保护因素(P=0.015)。12、回顾性收集本中心头颈部鳞癌患者肿瘤标本79例,通过随访调查患者的生存情况及总生存时间,IL2RG的免疫组织化学染色分析结果显示,IL2RG免疫组化结果为阳性的患者预后良好(P=0.0017)。通过MSP实验评价本中心头颈部鳞癌患者LCK甲基化状态,并联合IL2RG免疫组化结果分析与头颈部鳞癌患者预后的关系,结果发现LCK未发生甲基化且IL2RG表达阳性的患者长期生存期明显优于LCK发生甲基化且IL2RG表达阴性的患者,差异有统计学意义(P=0.0075)13、通过对头颈部鳞癌单细胞数据集进行分析,结果表明IRIM模型评分与T细胞密切相关。14、T细胞亚群分析结果表明,IRIM模型评分主要可以提示头颈部鳞癌患者肿瘤微环境的耗竭型T细胞聚集。结论:1.IL2RG转录组水平和LCK甲基化水平共同参与的Interleukin-2 family signaling信号通路是头颈部鳞癌预后的危险因素。IL2RG是头颈部鳞癌患者的保护因素,LCK甲基化是头颈部鳞癌患者的危险因素。2.IRIM模型是提示头颈部鳞癌免疫分型的重要预测模型,其可以筛选免疫炎症型头颈部鳞癌患者,有效预测免疫检查点抑制剂的治疗疗效。