论文部分内容阅读
研究背景肺癌的发病率和死亡率在恶性肿瘤中均位居前列。随着基础科学、科学技术和统计学的发展,对肺癌的研究也更加深入和全面。其中在肺癌的GWAS研究中,找到了许多与肺癌的发生发展相关的基因多态性。随着免疫治疗时代的到来,与免疫相关的基因多态性再次成为研究热点。主要组织相容性复合体I类分子(MHC-I)是细胞免疫的中心媒介,主要通过控制抗原呈递过程来调节细胞毒性T淋巴细胞(CTL)的功能,并作为自然杀伤细胞(NK)识别的标记物。MHCI类分子在细胞表面暴露出细胞内蛋白质,使得T细胞检测到内源性或突变的外源性抗原,一个有效的CTL反应依赖于MHC-I类分子提呈多种多肽阵列的能力,另一方面,CTL对肿瘤细胞的细胞免疫效果高度依赖于肿瘤细胞和抗原提呈细胞表面的MHC-I复合物的表达。由于MHC-I通路在细胞免疫中的重要作用,我们假设在肿瘤抗原呈递过程中参与MHC-I通路的基因的遗传变异与非小细胞肺癌(NSCLC)患者的预后相关。因此本研究以MHC-I通路作为对象,以GWAS数据库分析作为材料,分析MHC-I通路与NSCLC患者预后之间的关系,并对新发现的与预后相关的基因进行初步探索。第一部分 MHC-I通路中基因多态性与NSCLC患者预后之间的关系研究目的:(1)将两个GWAS数据库分别作为发现库和验证库,用以发现和验证MHCI通路中与NSCLC患者预后相关的基因多态性。用发现库中肺癌患者的临床资料进行独立性检验,找到与预后独立并且显著相关的SNPs。(2)对筛选出的与预后独立相关的SNPs分别进行组合和分层分析,明确这些SNPs与预后之间的关系。再通过ROC模型建立来观察其是否能对已经存在的NSCLC患者生存预测能力进一步提升。材料和方法:本研究采用两个GWAS数据库:一个是包含了1185个NSCLC病例的GWAS数据库,数据库名称为:PLCO(Prostate,Lung,Colorectal and Ovarian);另一个是包含了984个NSCLC病例的GWAS数据库,数据库名称为:HLCS(Harvard Lung Cancer Susceptibility Study)。前者作为发现数据库,后者作为验证数据库。对发现库中89个MHC-I通路上的基因进行SNPs的提取和填补,然后分析所有7811个SNPs与生存之间的关系,方法为多变量的风险回归模型。为降低出现假阳性的可能,对与生存显著相关的SNPs采用BFDP(Bayesian false-discovery probability)进行数据校正,校正的阈值为0.80。将校正过的206个SNPs位点在验证数据库中进行验证,之后得出在两个数据库均与生存显著相关的SNPs。在经过独立性检验后,最终得到3个基因上的3个SNPs与生存显著并且独立相关,分别是:ERAP1 rs469783T>C;NCF2 rs36071574G>A;PSMF1 rs13040574C>A。之后进行3个SNPs各基因型的组合和分层分析。最后我们建立了ROC预测模型,探索新发现的SNPs能否提升已有的临床资料对患者生存的预测能力。研究中用到的软件有SAS软件,R语言,Haplo View等。结果:(1)发现库中NSCLC患者的临床资料和患者生存期的关系在本研究我们发现,来源于发现库中患者的临床资料与患者的生存期存在密切的相关性,并且具有统计学上的意义(P<0.05)。(2)MHC-I通路中的SNPs与NSCLC患者生存期的相关性分析对MHC-I通路中的89个基因填补后得到7811个SNPs,通过BFDP验证,得到206个SNPs与发现库中NSCLC患者的生存显著相关。再在验证库中进行验证,找到了24个SNPs在两个数据库均与生存显著相关。(3)发现数据库验证24个SNPs中与生存独立相关的SNPs为了确认在发现库中与NSCLC患者生存独立且显著相关的SNPs,我们在发现库中建立了Cox模型,该模型纳入的资料包括临床变量和发现库中的部分成分,该模型为多变量逐步回归分析模型。将24个在两个数据库中均具有显著性的SNPs加入模型。最终,这24个SNPs里面的3个SNPs(即:ERAP1 rs469783 T>C、NCF2 rs36071574 G>A、PSMF1 rs13040574 C>A)在该模型中与患者生存期显著且独立相关。(4)独立相关的SNPs在两个数据库中的meta分析在进行异质性分析后,发现本研究中的3个SNPs(ERAP1 rs469783 T>C、NCF2 rs36071574 G>A、PSMF1 rs13040574 C>A)在发现库和验证库中都和患者的生存期独立且显著相关,未在两个数据库之间发现显著的异质性(P异质性>0.05)。(5)单个SNP的基因型与患者生存期的关系采用SNP的显性模型进行基因型的分类,然后分析单个基因型与患者生存期的关系,发现对比作为野生型的纯合子,3个SNPs中的基因型:ERAP1 rs469783TC+CC,PSMF1 rs13040574 CA+AA有更好的预后,HR分别为0.67,95%CI=0.55-0.81,P=<0.0001;0.78,95%CI=0.66-0.91,P=0.002;而NCF2 rs36071574GA+AA基因型的患者预后更差,HR为1.29,95%CI=1.03-1.62,P=0.030。(6)PLCO数据库三个独立SNPs的组合效果为进一步分析3个SNPs的组合效果,将所有基因型中的风险基因型即:ERAP1 rs469783 TT,PSMF1 rs13040574 CC,NCF2 rs36071574 GA+AA进行组合分析。我们发现在发现库的多因素分析中,随着3个SNPs风险基因型的增多,NSCLC患者的死亡风险逐渐增加(Ptrend<0.0001)。之后将这些基因型进一步做两分法,即分为了风险基因型少的基因型组(0-1)和风险基因型多的基因型组(2-3)。在和风险基因型少的基因型组对比中,风险基因型多的基因型组的患者无论是疾病特异性生存期(DSS)还是总生存期(OS)都明显缩短。DSS死亡风险升高1.51倍,(HR=1.51,95%CI=1.22-1.87,P=0.0001);OS死亡风险升高1.52倍(HR=1.52,95%CI=1.24-1.86,P<0.0001)。(7)三个SNPs对生存影响的分层分析本研究对这3个独立相关SNPs进行了少风险基因型组(0-1)和多风险基因型组(2-3)的分层,在临床资料之间进行了分层分析,并进行了相互作用之间的异质性检验。结果显示在分层分析中,3个SNPs组成的少风险基因型组和多风险基因型组与临床资料间未发现异质性(P异质性>0.05)。(8)对NSCLC患者预后预测模型的建立本研究采用了临床资料联合发现库的部分成分来建立ROC模型,进而预测在既往临床资料基础上联合本研究发现的3个SNPs,是否可以对患者生存的预测能力进一步提高。我们发现:在本研究中发现的3个SNPs对于患者5年的生存预测能力没有显著提高(5年OS:P>0.05;5年DSS:P>0.05),但是在进行更长时间的预测时,对于预测患者10年生存期的能力明显提高(10年OS:P=0.022;10年DSS P=0.030)。结论:(1)在该研究中发现库的临床资料与NSCLC患者的预后密切相关。(2)MHC-I通路中3个基因多态性位点ERAP1 rs469783 T>C、NCF2rs36071574 G>A、PSMF1 rs13040574 C>A与NSCLC患者预后独立相关。(3)研究中发现的3个SNPs的风险基因型在多因素分析下和更差的预后相关,而且在风险基因型(ERAP1 rs469783 TT,PSMF1 rs13040574 CC,NCF2rs36071574 GG+GA)数目增多时,患者死亡风险逐渐增高,即风险基因型多的患者相较于风险基因型少的患者生存期缩短。3个SNPs组合后分层分析未发现与临床资料间存在异质性。(4)MHC-I通路中3个SNPs所建立的预测模型能够在10年层面提高已有的临床变量对NSCLC患者预后预测的能力。第二部分 调控ERAP1表达对肺癌细胞增殖迁移和侵袭能力的影响及机制探索研究目的:探索ERAP1表达水平与NSCLC细胞增殖转移的关系。通过蛋白组学探索ERAP1通过哪些信号通路影响NSCLC细胞的增殖、迁移和侵袭的能力。材料和方法:把携带ERAP1基因的干扰片段导入至NCI-H226和A549细胞。验证导入干扰片段后,该细胞m RNA以及相关蛋白的表达情况。采用CCK8方法观察ERAP1表达水平对NCI-H226和A549细胞增殖的影响;再采用细胞克隆形成实验检测NCI-H226和A549细胞克隆能力的变化;通过细胞凋亡实验检测NCI-H226和A549细胞凋亡能力的变化;通过Transwell实验检测ERAP1对NCI-H226和A549细胞迁移和侵袭能力的影响;通过蛋白组学及GO、KEGG富集分析,探索ERAP1作用的信号通路。统计学处理:研究中的数据统计采用SAS9.4软件,各组结果比较采用T检验。P<0.05为有显著差别。结果:(1)ERAP1敲降细胞株的建立q RT-PCR和Western blot结果显示,ERAP1沉默组中ERAP1 m RNA及蛋白的表达水平均低于Control组(P<0.05)。(2)ERAP1敲降对细胞增殖、迁移和侵袭能力的影响及机制探索与Control组对照:CCK8实验结果显示ERAP1敲降组细胞增殖能力显著下降(P<0.05);细胞克隆形成实验结果显示ERAP1敲降组克隆形成显著减少(P<0.05);细胞凋亡实验结果显示ERAP1敲降组细胞凋亡显著增加(P<0.05);通过Transwell迁移和侵袭检验后发现,ERAP1敲降组比Control组的穿膜细胞数量明显减少(P<0.05);通过蛋白组学研究,在蛋白表达差异设定为1.5倍时,发现了127个显著升高表达的蛋白和156个显著降低表达的蛋白,表达水平具有1.5倍以上的差异蛋白在研究中主要富集于PPAR等通路上。结论:(1)ERAP1敲降细胞株相较于正常细胞株,细胞的增殖、迁移和侵袭能力均明显下降。(2)通过蛋白组学分析发现与ERAP1敲降前后相关的差异蛋白主要富集于PPAR等通路上。ERAP1可能通过影响PPAR信号通路进而影响了肺癌细胞的增殖和侵袭。