论文部分内容阅读
疫苗因其能够激活免疫系统以预防或治疗感染和一些其他疾病而对人类健康有着重要的影响,然而预防性的癌症疫苗目前仅对病毒来源的癌症有效,如人类乳头瘤病毒介导的宫颈癌。Sipuleucel-T疫苗是美国食品药品管理局(FDA)首个批准的治疗性的癌症疫苗,对前列腺癌的治疗也并没有取得预期的良好效果。与其他的免疫疗法相比,例如免疫检查点抑制(CPB,immune checkpoint blockade)、过继T细胞疗法(Adoptive cell transfer,ACT)以及抗原嵌合受体疗法(Chimeric antigen receptors,CARs)相比,大多数疫苗都不能引起显著的临床效果。肿瘤新抗原疫苗是近年来开发出的一种有效的癌症疫苗,也是目前最具前沿性的抗肿瘤疫苗技术之一,接种新抗原疫苗既可以扩大已有的新抗原特异性T细胞群,又可以在癌症患者中诱导更广泛的新型T细胞特异性,增强肿瘤的抑制。同时新抗原疫苗与其他免疫疗法如PD-1/PD-L1联合治疗效果更加显著,使得新抗原疫苗研制成为时下的抗肿瘤研发的热点,尤其是筛选肿瘤新抗原肽的技术成为了疫苗制备的关键。新一代测序技术极大推动了新抗原疫苗的可行性,但从测序识别肿瘤的体细胞突变到TCR(T-cell receptor)识别肿瘤新抗原产生免疫反应中间存在着大量的候选假阳性新抗原多肽,这些无法激活T-cell免疫的多肽给临床实验的验证带来了极大的困扰。这对于针对新抗原肽而设计的肿瘤疫苗无疑是一个大的麻烦。一套有效合理的筛选方法,是新抗原疫苗制备过程中不可或缺的一环,具有极高的现实意义本文立足于肿瘤新抗原预测研究,总结了目前基于生物信息学方法的肿瘤新抗原预测策略,并通过收集文献及数据库中真实经过实验手段验证的HLA-I类表位肽,从多肽序列氨基酸理化性质、结构特征、多肽信息熵角度联合p-HLA预测亲和力评价指标的%rank值,筛选出24种表位免疫原性相关的特征,采用有监督学习算法-随机森林(Random Forest)预测表位肽的免疫原性。对于抗原表位的分类较之先前的研究有着更好的表现:五折交叉验证最优AUC(Area Under Curve)可达0.81;额外收集的外部验证数据集依然展现了良好的分类效果(最优AUC可达0.77)。更进一步,由于新抗原表位是建立在抗原表位基础之上的突变表位,编码区产生的新抗原相对于抗原多肽仅有一到两个氨基酸的不同。因此我们在抗原表位预测模型的基础之上额外增加了三个与突变相关的潜在的免疫原性特征包括:1)突变前后新抗原表位的氨基酸疏水性的变化;2)突变前后新抗原表位p-HLA结合预测评价指标%rank值的变化;3)新抗原突变位点是否位于锚定位置。联合抗原识别预测的24个相关的免疫原性特征,共计27个特征用于训练分类实验验证的新抗原多肽,其最优五折交叉验证AUC可达0.78。最后,基于这两个随机森林算法的模型,我们开发了网页版工具INeo-Epp(http://www.biostatistics.online/INeo-Epp/antigen.php),该工具可以实现对抗原及新抗原表位的免疫原性预测,帮助在p-HLA结合预测的基础上更进一步筛选出真实的新抗原肽,辅助缩短新抗原疫苗制备的流程。综上所述,本文从TCR识别HLA-peptide结合(p-HLA)复合物过程入手,收集文献以及相关数据库中实验验证能够产生免疫反应的抗原肽段,探寻产生免疫原性抗原肽所具有特性,为进一步辅助筛选肿瘤新生抗原肽提供新的方案,本研究可以帮助扩充国内关于肿瘤新抗原预测的研究,并有助于相关领域研究者们增加对T-cell识别抗原肽的新的理解,使免疫研究变得更加便捷。