论文部分内容阅读
喉癌是耳鼻咽喉-头颈外科第二高发肿瘤,其中喉鳞状细胞癌(laryngeal squamous cell carcinoma,LSCC)占病理分型的95%。随着禁烟措施的实施,近三年新发病例总人数呈小幅降低,但发病率仍较高,约占所有癌症的1%。喉癌病因复杂,早期症状多不明显,晚期生存率仍较低。因此,充分探索喉癌尤其转移性喉癌发病机制,寻找稳定、可信的喉癌治疗、预后评估靶点,开发新的治疗方法,十分必要。基质金属蛋白酶(matrix metalloproteases,MMPs)是依赖金属离子的多基因家族内肽酶,是细胞外基质和基底膜降解的主要水解酶,也是参与肿瘤转移的主要蛋白家族。MMPs以无活性的酶原形式分泌到细胞外,在正常的生理和病理过程中发挥重要作用。数据库中用于转录组分析的MMPs家族基因有25个。针对TCGA数据库头颈鳞状细胞癌(head and neck squamous cell carcinoma,HNSC)的转录组数据分析结果显示,差异前10的基因中,有6个基因都属于MMPs家族,提示MMPs家族在HNSC的发生和进展中可能发挥着重要作用。因此,在LSCC中对这一转移相关蛋白家族进行转录组表达分析、预后相关性分析及机制研究,对于寻找LSCC特异性转移风险评估标志物、精准治疗靶点意义重大。长链非编码RNA(long non-coding RNAs,Lnc RNAs)是长度超过200个核苷酸的转录本,其构成哺乳动物大部分的转录组数据。文献报道超过一半的人类Lnc RNAs与已知的蛋白质编码基因基因组位置重叠或毗邻。由于寡核苷酸序列的保守性相对较差,因此针对Lnc RNAs在细胞和动物模型中功能的研究应用转化有限。尽管如此,越来越多的Lnc RNAs已被证明具有多种显著的生物学功能,例如,调控基因表达、保护基因组免受外源基因的影响、指导DNA合成或基因组重排等。此外,越来越多的研究表明,Lnc RNAs与肿瘤的发生密切相关。在喉癌中,几个关键Lnc RNAs也被发现发挥癌基因或抑癌基因功能,参与喉癌的发生、转移,与患者的预后密切相关。因此,深入研究Lnc RNAs在喉癌中的表达、功能及机制,对于增加喉癌生物标志物和治疗靶点有重要意义。本研究应用癌症基因图谱(The Cancer Genome Atlas,TCGA)、基因表达汇编(Gene Expression Omnibus,GEO)等公共数据库和芯片数据,分析MMPs家族和Lnc RNAs在LSCC中的表达水平,寻找LSCC相关组织特异性基因。此外,考虑到TCGA数据库具有完整的RNA-seq数据和患者生存信息,我们对TCGA数据库LSCC数据进行预后的单因素和多因素Cox回归分析,最终构建基于MMPs家族和Lnc RNAs的Cox预后模型。然后,针对模型中的关键基因MMP-1和Y染色体相关Lnc RNA LINC00278,采用MTS实验、克隆形成实验、Transwell小室和划痕实验明确其对细胞增殖、侵袭和迁移能力的影响,并深入研究相关机制。具体各部分研究内容如下:第一部分基质金属蛋白酶家族在喉鳞状细胞癌中的预后分析及作用研究目的:阐明MMPs家族中与LSCC发展、预后相关的关键基因,并明确关键基因MMP-1对肿瘤细胞功能的影响及机制。方法:1.用“edge R”包分析TCGA数据库中LSCC MMPs家族的差异基因;GEO数据库中用“Limma”包分别分析各个LSCC芯片数据集的差异基因,并用“Robust Rank Aggreg”包对各个数据集进行整合分析;对公共数据库和自己芯片数据的差异基因取交集,得出共同差异基因。2.根据TCGA数据库LSCC患者的生存信息用“survival”、“survminer”包进行单因素Cox回归分析,并根据结果进一步行多因素Cox回归分析,选择AIC值最小的预后模型为最终预后模型,“Survival ROC”包绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under curve,AUC),比较MMPs相关预后模型,TNM分期,临床分级等因素的AUC值判断该预后模型的性能;Cox回归分析对LSCC患者进行独立预后分析并用“rms”包构建诺模图。3.用R包“WGCNA”对提取的高/低危组差异基因和MPPs家族基因进行WGCNA分析,用Cytoscape软件进行可视化处理。4.用R包“Estimate”对转录组数据进行肿瘤间质评分、免疫评分和肿瘤纯度评分;用Ciber Sort方法对浸润免疫细胞进行评估。5.分别在Oncomine数据库和GEPIA数据库中比较MMP-1、MMP-3、MMP-8和MMP-10在不同肿瘤中表达情况,并用实时荧光定量PCR(Quantitative Real-time PCR,q RT-PCR)在40对LSCC配对组织中对MMP-1、MMP-3和MMP-10进行验证,分析MMP-1的表达与临床特征的关系,并根据q RT-PCR表达值和患者生存信息对预后模型进行外部数据验证。6.通过转染小干扰RNA(small interfering RNA,si RNA)敲低肿瘤细胞关键基因MMP-1的表达,并用MTS实验、克隆形成实验、Transwell小室和划痕实验分别检测细胞增殖、侵袭和迁移能力的变化。7.用“Cluster Profiler”包对MMP-1共表达基因做KEGG信号通路富集,根据MMP-1的表达量将TCGA中111例LSCC患者分为高/低表达两组,分别比较两组患者间肿瘤微环境的差异。结果:1.通过整合3个公共数据库和微阵列数据,从MMPs家族中25个基因筛选出MMP-1、MMP-3、MMP-9、MMP-10、MMP-11、MMP-12和MMP-13共7个差异基因。2.采用多因素Cox回归分析构建了4个基因(MMP-1、MMP-3、MMP-8和MMP-10)的预后模型。MMPs相关预后模型(红线下面积=0.641)的AUC值高于基于TNM分期模型(蓝线下面积=0.536)、基于临床分级模型(绿线下面积=0.523)和基于男女性别模型(黄线下面积=0.374)。并且与年龄、性别、肿瘤临床分级和TNM分期等因子比较,MMPs相关预后模型是LSCC患者的独立预后因素(P=0.015)。3.WGCNA分析显示,MMPs相关预后模型中的4个基因(MMP-1、MMP-3、MMP-8和MMP-10)不是孤立存在的,而是一个复杂的互做网络,MMP-1与MMP-3和PRSS23高度相关,MMP-8与MMP-9高度相关;MMP-10与FN1和IL24高度相关。4.MMPs相关预后模型与肿瘤微环境调控相关,高风险组的肿瘤间质得分高于低风险组,而肿瘤纯度低于低风险组。在免疫评分这一项,虽然高/低风险组之间没有显著统计学差异,但高风险组免疫评分的中位值明显高于低风险组。并且浆细胞、CD8+T细胞、滤泡辅助T细胞、静息NK细胞以及M0巨噬细胞这5种免疫细胞在高/低风险两组患者中存在显著差异。5.MMP-1、MMP-3和MMP-10在HNSC中的表达较其他类别肿瘤都高。同时,40例配对组织q RT-PCR结果显示,MMP-3和MMP-10分别在34/40、31/40对LSCC组织中表达上调,MMP-1在全部配对LSCC组织中表达上调(40/40)。此外,外部独立数据集验证预测模型的一致性指数(coefficient)为0.847,并且高/低风险两组患者间生存率有显著统计学差异(P=0.0042)。6.MMP-1的表达水平与患者吸烟(P<0.001)、TNM分期(P<0.001)、淋巴结转移(P<0.001)和病理分化程度(P<0.001)显著相关,与患者年龄、饮酒和原发肿瘤部位无关。并且,敲低MMP-1的表达抑制了TU686细胞和Fa Du细胞的活细胞率、单克隆集落形成数目、细胞划痕距离以及穿过Transwell小室的细胞个数。7.KEGG功能富集显示PI3K-Akt信号通路被显著富集;ESTIMATE计算结果显示MMP-1高表达组的肿瘤间质得分高于低表达组,而肿瘤纯度高表达组低于低表达组。虽然免疫评分在高/低表达组之间没有显著统计学差异,但高表达组免疫评分的中位值明显高于低表达组;幼稚B细胞、记忆B细胞、CD8+T细胞、滤泡辅助T细胞、调节性T细胞、静息NK细胞、单核细胞、M0巨噬细胞、活化的树突状细胞以及活化的肥大细胞在MMP-1高低两组间有显著统计学差异。第二部分长链非编码RNA LINC00278在喉鳞状细胞癌中的作用及机制研究目的:本部分基于Lnc RNAs构建LSCC预后模型,并针对模型中Y染色体定位Lnc RNA LINC00278(也是MMPs家族相关Lnc RNA),探讨其在LSCC中的表达及其对LSCC细胞增殖、迁移和侵袭的作用,为挖掘LSCC潜在的诊断和治疗靶点提供有力的理论依据。方法:1.用“edge R”包分析TCGA数据库中LSCC差异Lnc RNAs;用“survival”、“survminer”包进行单因素Cox回归分析,并根据结果进一步行多因素Cox回归分析,选择AIC值最小的预后模型为最终预后模型;“Survival ROC”包绘制ROC曲线,比较Lnc RNAs相关预后模型、TNM分期、临床分级等因素的AUC值判断该预后模型的性能;预后模型中的Lnc RNAs最终在GEO数据库中进行表达验证。2.q RT-PCR在72对LSCC配对组织中检测LINC00278的表达,分析LINC00278的表达与临床特征的关系,并根据q RT-PCR表达值和患者生存信息对LINC00278行Kaplan-Meier生存分析。3.通过MTS、克隆形成、划痕和Transwell小室实验证实过表达LINC00278对LSCC细胞增殖、迁移和侵袭的影响;并用裸鼠皮下成瘤模型判断LINC00278体内抑瘤作用。同时,Western blot检测EMT相关蛋白的表达。4.利用h TFtarget在线网站预测LINC00278的转录因子和结合位点。用p GL3-basic载体构建LINC00278启动子截短质粒和突变质粒,双荧光素酶报告基因和染色质免疫沉淀(Chromatin Immunoprecipitation,Ch IP)检测转录因子ETS1和LINC00278启动子区域的结合。结果:1.TCGA数据库中共筛选出790个差异表达的Lnc RNAs,其中上调基因665个,下调基因125个;多因素Cox回归分析构建了包含6个Lnc RNAs的预后模型(LINC00278、MYHAS、MNX1-AS1、LINC02086、LSAMP-AS1和CASC20)。2.Lnc RNAs相关预后模型的AUC值(红色曲线下面积=0.832)显著高于按肿瘤TNM分期(黄色曲线下面积=0.614)、肿瘤临床分级(绿色曲线下面积=0.633)、患者性别(橙色下面积=0.485)、饮酒(蓝色下面积=0.421)和吸烟(粉红色下面积=0.511)的预后模型。3.在6个Lnc RNA中,只有LINC00278和CASC20的表达在TCGA和GEO数据库中均具有差异,并且最终选择LINC00278进行下一步研究(也是MMPs家族相关Lnc RNA)。4.LINC00278在LSCC癌组织中低表达,并且LINC00278的表达与肿瘤的TNM分期(P<0.001)、淋巴结转移(P<0.01)、病理分化程度(P<0.01)显著相关,与年龄、吸烟、饮酒和原发肿瘤部位没有相关性。生存分析结果显示LINC00278低表达患者的总生存期(Overall Survival,OS)低于LINC00278高表达患者。5.过表达LINC00278抑制AMC-HN-8、TU177、TU686和Fa Du细胞的活细胞率、单克隆集落形成数目、细胞划痕距离以及穿过Transwell小室的细胞个数;LINC00278过表达组的瘤体体积和平均肿瘤重量比空载体组显著降低;并且LINC00278过表达时E-钙粘蛋白m RNA和蛋白表达均增高,而N-钙粘蛋白、β-连环蛋白、波形蛋白、Twist、ZEB1和Snail的m RNA和蛋白表达降低。6.双荧光素酶报告基因结果显示,LINC00278启动子的Region1(第一外显子区)荧光活性最强,该区域突变质粒的相对荧光素酶活性较野生型质粒的相对荧光素酶活性低;Ch IP结果显示转录因子ETS1与LINC00278启动子的Region1结合能力最强。结论:1.MMPs家族在LSCC组织中共7个显著差异的基因,经过单因素/多因素Cox回归分析后,构建了包含4个MMPs基因(MMP-1、MMP-3、MMP-8和MMP-10)的预后模型,该预后模型具有较好的预测准确性和可信度,并能参与肿瘤微环境的调控,对LSCC患者的预后判断具有重要意义。2.MMP-1在LSCC组织中的表达具有组织特异性,高表达MMP-1的患者OS低于MMP-1低表达患者,并且MMP-1的表达与TNM分期、淋巴结转移等代表肿瘤进展程度的临床特征显著相关。同时,MMP-1促进LSCC细胞的增殖、迁移、侵袭能力,其作用机制可能与PI3K-Akt信号通路和肿瘤微环境有关。3.多因素Cox回归分析构建了包含6个Lnc RNAs的预后模型(LINC00278、MYHAS、MNX1-AS1、LINC02086、LSAMP-AS1和CASC20),其中LINC00278和CASC20的表达在TCGA和GEO数据库中均具有差异,并且LINC00278也是MMPs家族相关Lnc RNA。4.LINC00278在LSCC癌组织中低表达,低表达LINC00278的患者OS低于LINC00278高表达患者,并且LINC00278的表达与TNM分期、淋巴结转移等代表肿瘤进展程度的临床特征显著相关。LINC00278抑制LSCC细胞的增殖、迁移、侵袭能力,并受转录因子ETS1调控。