论文部分内容阅读
目的:胃癌是全球危害人类健康的主要的恶性肿瘤之一,2014年全球新生病例约110万人(不包含未就诊患者),仅在中国,2014年新发病例为49万,占全球新发胃癌病例总数的44.6%;胃癌的发生与幽门螺杆菌(Hp,H.Pylori)感染密切相关[1,2],本文应用Luminex[3]技术检测胃癌血清蛋白标志物的表达,结合IgG to H. pylori的ELISA,探讨胃癌血清学标志物与胃癌诊断以及肿瘤分期等的相关性分析;应用PPA(Protein PathwayArray)[4]技术研究幽门螺杆菌感染胃癌组织中炎症代谢相关蛋白PathwayArray的表达情况,寻找其中关键蛋白质。方法:第一部分中应用Luminex技术,构建9种血清标志物的检测试剂盒,结合ELISA检测IgG to H. pylori,检测285例胃癌病人和238例健康体检者血清蛋白表达情况(胃癌病人208/285Hp阳性,77/285Hp阴性;健康体检者92/238Hp阳性,146/238Hp阴性)。全部胃癌病人及健康体检者清晨空腹采血静止后离心获得血清,全部病人进行了胃镜及胸部平片(女性患者行乳腺检查)排除其他肿瘤及炎症、感染状态。将胃癌病人及健康体检者血清一并随机分组进行检测,将检测结果与胃癌诊断及肿瘤分期等进行相关性分析,建立诊断模型。我们还应用随机森林(random forest,RF)、支持向量机(support vectormachine,SVM),Logistic回归,COX风险回归来分析诊断模型。第二部分中应用ProteinPathway Array技术对Hp感染胃癌组织的炎症、代谢通路相关蛋白进行分析,并应用Ingenuity Pathway Analysis(IPA)[5]分析软件研究PPA筛选的关键蛋白质在Hp感染胃癌中的关键信号通路。结果:在第一部分中我在先前的研究基础上[6,7]及文献[8~12]复习的基础上,成功构建了9种血清蛋白标志物Luminex试剂盒(Pepsonigen-I[8],Pepsonigen-II[7],ICAM-1[9],COX-2[6],ADAM8[6],VEGF[10],EGFR[11],beta-Catenin[7],Hemoglobin[12])并组合成Luminex实验平台,该实验平台可快速联合定量测定人体血清上述蛋白水平,其不仅仅操作简单快速,灵敏度高,而且重复性好,检测范围广,节省了时间和标本用量。在本研究中我们应用Luminex的方法对285例胃癌病人和和238例健康体检者检查了上述9项血清学蛋白指标,应用ELISA的方法检测了IgG to H. pylori[7]的血清表达,一共检测了10个血清蛋白的表达。统计学相关分析中发现这10种蛋白中Beta-Catenin、COX2和VEGF3种蛋白质具有明显相关性关联。所有样品按照是否患癌症指标无放回分层抽样80%作为训练集,剩下20%作为测试集。我们在训练集上做变量选择嵌套交叉验证[13],方法为随机森林交叉验证变量选择的方法(Wrappers for Feature Subset Selection,Ron KohaviRandom Forest Cross-Valdidation for feature selection),发现模型只纳入5种蛋白(IgG toH. pylori, ADAM8,Pepsonigen-I,Pepsonigen-II,VEGF),训练集的交叉验证错判率(17.55%)最低,不仅如此,该统计方法还能够大幅降低运算时间,提高运算效率,所以后续的判别模型都只用建立上述5种蛋白。在训练集上我们建立了3种判别模型:随机森林(Random Forests,RF)[14]、支持向量机(Support Vector Machine,SVM)[15]、Logisitic回归,模型的参数通过交叉验证确定,判别效果通过准确度、灵敏度、特异度检测、AUC评估。我们模型的结果是,验证组中样品在算法RF的准确度达82.5%、灵敏度86.0%、特异度78.4%,算法SVM的准确度达86.1%、灵敏度88.6%、特异度83.2%,logistic回归的准确度达78.7%、灵敏度82.9%、特异度73.7%。这3种算法的结果明显优于传统肿瘤标志物[16]。特别是SVM和RF的效能明显优于Logistic回归的结果。应用R软件survival工具包进行胃癌病人血清中蛋白表达值log-rank分析,得出病人预后具有明显差异蛋白cutoff值(P<0.05),经过分析PGI、PGII、HB、VEGF、Beta-Catenin能够获得cutoff数据能够将病例分为高危险组和低危险组,其他蛋白未能获得满意的cutoff截点,低危险组的生存期明显好于高危险组。绘制了该5个蛋白相关的诺模图用于评价预后。在第二部分中应用PPA技术研究Hp感染胃癌组织与非Hp感染胃癌组织中的炎症、代谢相关通路蛋白的表达情况,共分析了85例胃癌患者的组织标本,其中52例被鉴定为Hp血清学阳性(61.2%)。我们应用SAM工具统计分析后,在Hp阳性胃癌与Hp阴性胃癌之间有11个蛋白质存在差异性表达的(q值小于0.05并且假发现率小于5%)。在11个蛋白质中,有7个蛋白质在Hp阳性胃癌中呈现高表达,包括BAK1、HIF-1α、IL6、IL8、IL10、DACH1、HSP70,有4个蛋白质在Hp阳性胃癌中呈现低表达,包括CDC2、L-selectin、P27及DPYD。同时,我们应用IPA系统,以我们检测出来的信号蛋白为节点,通过直接或者间接的关系彼此之间相互作用,构成了相应的信号传导网络,分析结果表明,这些蛋白质与细胞死亡和生存,DNA复制、重组以及修复,细胞周期,细胞发展以及细胞生长和增殖相关。经过IPA系统进一步分析了7个差异性表达的蛋白质中的上游调节子,一共有345个上游调节子,其中共同的上游的调节蛋白中具有统计学意义的有6个蛋白质,包括BCL2,magnolol,epinephrine,RET,PI3K (complex)以及BRAF。我们还发现,在这6个上游所调控的下游蛋白中,BAK1具有2个上游调节子,HIF1A具有4个上游调节子,IL10具有5个上游调节子,CDK1具有3个上游调节子,CDKN1B有6个上游调节子,CXCL8具有6个上游调节子,IL6具有4个上游调节子,上述6个上游调节蛋白及下游蛋白可能为进步一选择治疗靶点存在指导意义。结论:我们成功构建了胃癌血清蛋白标志物标志物的Luminex定制实验平台,并且成功应用其对胃癌和健康体检者进行检测,其联合检测的RF及SVM模型对胃癌诊断的准确率、灵敏度及特异度较高,该平台能够发展用于健康体检、高危人群筛选、临床诊治等方面的应用;经过分析PGI、PGII、HB、VEGF、Beta-Catenin能够获得cutoff数据能够将病例分为高危险组和低危险组,绘制诺模图;对Hp感染和非感染胃癌组织中炎症、代谢信号相关蛋白的表达分析发现明显差异蛋白BAK1、HIF-1α、IL6、IL8、IL10、DACH1、HSP70的表达,并找到其上游关键信号传导通路BCL2,magnolol,epinephrine,RET、PI3K (complex)以及BRAF,这是今后继续研究和靶向治疗的靶点。