论文部分内容阅读
背景与目的:肺癌是全球范围内癌症死亡的主要原因,每年全球因患肺癌死亡的人数超过一百万。由于缺乏有效的早期肺癌的诊断手段,肺癌患者的5年死亡率高达80%。传统的病理生理研究以单基因及其转录、蛋白质的功能特点为基础,从分子水平上解释生命机制,但仅限于局部。生物网络可以直观展现生物系统中各局部功能部门之间的相互联系,从整体上对生物系统进行深入、全面的研究。加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)利用了系统生物学的思想寻找基因之间表达的相似性,并将表达高度相关的基因确定为一个基因模块。目前已有一些研究支持,肺癌患者甚至部分吸烟者的气道上皮的损害延伸到了鼻,这有利地提示,利用鼻基因表达作为肺癌检测的非侵入性生物标志物的可能。因此,从鼻腔上皮细胞中识别有意义的共表达基因簇可能有助于肺癌患者的筛查。本研究基于公共微阵列数据集(数据集GSE80796,从GEO下载),进行WGCNA探讨、计算基因模块特性的相关性并进行qRT-PCR技术定量顶级枢纽基因表达的实验验证。材料与方法:基于公共微阵列数据集GSE80796进行WGCNA分析以及模块性状的相关性计算。该数据集中包含505个样本,共32321个基因。选取了 196个肺癌鼻粘膜上皮细胞样本的5000个基因,其中96个是肺癌鼻粘膜组织样本,另100个为相应的肺正常鼻粘膜组织样本。使用Limma软件包中的RMA、SVA和T-test来筛选差异表达基因(DEGS),共得到3600个差异表达基因。根据选择的不同样本表达数据,得到四组不同的差异表达基因,对这四组差异表达基因构建了四个不同的共表达网络,分别是混合数据组一、混合数据组二、男性特定数据和女性特定数据组,分别从特征基因模块中计算提取15个、25个、10个和10个枢纽基因。使用qRT-PCR技术定量验证基于混合数据组二WGCNA分析计算得到的12个顶级枢纽基因。利用SYBR GREEN I法对80例鼻粘膜拭子的WGCNA分析的12个相关基因的表达进行定量研究,实验分为三组:正常对比组30例,肺癌组32例,肺癌术后组18例。分别进行荧光定量PCR技术是通过荧光染料或荧光标记的特异性探针,对PCR产物进行标记跟踪,实时监控反应过程。随着PCR反应的进行,反应产物不断累积,荧光信号强度也等比例增加。每经过一个循环,收集一次荧光强度信号,这样就可以通过荧光强度变化监测产物量的变化,结合相应的软件分析,可以得到荧光扩增曲线,计算待测样品初始模板的量。当在荧光定量PCR检测系统中引入内参基因同时与目的基因检测,依据2-△ △Ct法计算出一个待测样本中目标核酸序列与校正样本中同一序列表达的相对变化。实验结果进行均数T检验统计学分析与比较(welch校正与Tamhane’s T2检验),确定肺癌鼻粘膜基因表达的差异性(P<0.05)。结果:1.WGCNA从混合数据组一的差异表达基因中构建了 9个共表达模块,其中与患癌状态关联性最强的是黑,黄,绿,蓝和浅蓝5个模块。GO通路富集结果显示,黑色模块的基因主要富集于GO:0006955(免疫应答)、GO:0034341(对干扰素γ的反应)和GO:0008009(趋化因子活性);而蓝色模块基因主要富集蛋白运输过程GO:0005654(核质)、GO:0005813(中心体)和GO:0046872(金属离子结合);浅蓝色模块的基因主要富集在GO:0042384(纤毛组装)和G0:0060271(纤毛形态);黄色模块的基因主要富集受体激活,包括GO:0004984(嗅觉受体激活)和GO:0004930(G-蛋白偶联受体激活)。IFI44L,THOK2,N EK11和CCDC144CP分别为四个模块的顶级枢纽基因。2.WGCNA从混合数据组二的差异表达基因中,构建了四个特定的LC模块,包括蓝色,棕色,黄色和浅蓝色,蓝色和棕色模块特征基因在各自模块内显示出很强的关联性。我们的分析结果表明HCK,NCF1,TLR8,EMR3,CSF2RB和DYSF基因是棕色模块中最重要的中枢基因,而SPEF2,ANKFN1,HYDIN,DNAH5,C12orf55,CCDC113基因分别是按照等级排列的顶级枢纽基因。3.鼻粘膜荧光定量PCR验证12个顶级枢纽基因表达实验发现,8个基因表达在肺癌与对照组之间具有显著性差异(0.05%),分布在肺癌与对照组间有6个基因(HCK、NCF1、TLR8、EMR3、CSF2RB、DYSF),肺癌术后与对照组有4个基因(HCK、CSF2RB、SPEF2、C12orf55);肺癌与肺癌术后组有2个基因(EMR3、C 12orf55)。在肺癌与对照组之间基因表达差异明显的是黏液蛋白样激素受体基因EMR3,Tamhane’ s T2/P值为3.051/0.000和中性粒细胞胞浆因子1(NCF1)基因,Tamhane’s T2/P 值为 2.937/0.001。4.在对男性、女性特定数据集的聚类树进行重复性分析时发现,基于男性、女性样本组特定的数据集,共识模块特征基因和临床特点表现出显著的相关性(P<0.05),而基于男女混合数据集时,共识模块特征基因与临床特征之间的关系表现为无相关(P>0.05)。分别对男性和女性特定表达谱数据的WGCNA,在男性特定数据中检测到与肺癌状态显著相关的黑色和绿色模块;同样,棕色模块被检测为女性特定基因表达谱中与肺癌患癌状态有意义的模块。进一步分析,从绿色基因模块内识别出个可能对肺癌发生有关键作用的10个枢纽基因,关联性由强到弱分别为 SP100、XAF1、EPSTL1、PARP9、APOL6、SAMD9L、MX1、BST2、GBP1、C MPK2。从棕色模块内识别出个可能对肺癌发生有关键作用的10个枢纽基因,关联性由强到弱分别为 PNPLA2、GAK、RNF31、ATG9A、EPS8L2、LLGL2、RABGGTA、TMEM63B、BRPF1、AP3D1。富集分析结果显示,男性数据集中注释系统中的富集术语主要与免疫反应和感染有关,女性数据集中注释系统中的富集术语主要与嗅觉转导有关。结论:1.WGCNA能够发现具有生物学意义的基因模块,并能深入挖掘枢纽基因、基因之间的调控及对肿瘤发生发展的影响。2.鼻粘膜上皮细胞 HCK、NCF1、TLR8、EMR3、CSF2RB、DYSF、SPEF2、C12orf55八个基因表达异常可能成为肺癌检测的非侵入性生物标记物;其中EMR3、C12o rf55二个基因表达异常可能用来观察术后肺癌治疗疗效情况。3.基于男性、女性样本组特定的数据集,共识模块特征基因和临床特点表现出显著的相关性,而对基于男性-女性混合样本数据集,共识模块特征基因与临床特征之间的关系表现无相关,说明了特征模块与性别相关的异质性。4.加权基因共表达网络分析与PCR验证基因表达量的结果具有一致性。