论文部分内容阅读
研究背景与目的:胃癌(Gastric cancer,GC)是我国最常见的恶性肿瘤之一,其发病率在所有肿瘤中高居第2位,死亡率则是第3位,严重地威胁了人们的健康。尽管早期胃癌通过根治性手术治疗可获得超过90%的5年生存率。但在我国只有约10%的患者为早期胃癌,绝大多数确诊时已为进展期,很多患者即使经过根治性手术、多疗程化疗等,仍会出现复发和转移,导致治疗失败,5年生存率低于30%。所以如何早期发现并早期诊断成为亟待解决的问题之一。尽管目前肿瘤治疗已经进入到精准医疗时代,但由于胃癌发生发展的分子机制尚未完全阐明,相对于其他肿瘤,胃癌的精准诊断和个体化治疗的研究进展缓慢,尚没有理想的疗效及预后预测指标,且靶向治疗药物在胃癌中的开发多以失败告终,目前化疗仍然是晚期胃癌的主要治疗手段,但其带来的生存获益有限,因此迫切需要进一步深入揭示胃癌发生发展的机制,从而为胃癌患者提供新的预后预测指标及治疗思路。越来越多的研究证实非编码RNA(non-coding RNA,ncRNA)特别是微小RNA(microRNA/miRNA)和长链非编码 RNA(long non-coding RNA,lncRNA)参与了胃癌的发生、转移、对化放疗抗性以及肿瘤微环境的建立等多种生物学功能。竞争内源性 RNA(competing endogenous RNA,ceRNA)可通过 miRNAs反应原件(MREs)竞争性结合miRNA,以达到调控基因表达的目的。研究发现信使 RNA(Messenger RNA,mRNA)、假基因(pseudogenes)、lncRNA、环状RNA(circRNA)等各种类型ceRNA可通过ceRNA网络来进行相互交流,从而调控肿瘤细胞及其微环境,在肿瘤的生长及转移过程中发挥了重要的功能,从而开辟了研究胃癌发病机制的新领域。另外随着现代科技的极大进步,基因芯片和测序技术被广泛应用,大量的生物信息数据被获取,各种数据库应运而生,最著名的是癌症基因组图谱(The Cancer Genome Atlas,TCGA),其他还包括基因表达公共数据库(Gene Expression Omnibus,GEO)、Oncomine数据库等。多组学数据的分析成为人们探索胃癌发生发展机制的重要工具。本研究选取在我院接受胃癌D2根治术治疗的5例患者癌及配对癌旁组织,运用生物芯片技术进行基因表达谱测定,应用R语言中的edgeR包筛选出癌和癌旁组织差异表达的mRNA、lncRNA和miRNA。运用在线生物学信息注释数据库即用于注释、可视化和集成发现的数据库(The Database for Annotation,Visualization and Integrated Discovery,DAVID)对差异表达的 DEmRNA 进行基因本体论(gene ontology,GO)生物学过程富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。应用在线的预测工具 miRTarBase、miRDB、star Base、DIANA-LncBase 预测DEmiRNA-DElncRNA、DEmiRNA-DEmRNA 相互作用,借助 Cytoscape 软件,对ceRNA网络可视化并筛选出hub基因,并利用OncoLnc数据库筛选出与胃癌预后相关的hub基因。通过本研究构建出的胃癌相关ceRNA网络,有助于深入了解胃癌发生和进展中涉及的分子机制,从而有助于寻找潜在的生物标志物和治疗靶点。研究材料与方法:1.选取在郑州大学第一附属医院接受胃癌D2根治手术的胃癌患者的新鲜癌组织及对应癌旁组织,其中癌旁组织为距肿瘤5cm以上的正常组织。新鲜组织标本切下后迅速置于液氮中冷冻保存备用。2.使用 Agilent Human miRNA(8x60K)array 芯片及 Agilent SurePrint G3 Human Gene Expression Microarray(8x60K)芯片,按照 Agilent 表达谱芯片和Agilent miRNA芯片配套提供的标准操作流程操作,芯片结果采用Agilent Microarray Scanner进行扫描,芯片扫描得到的原始数据由GeneSpring Software GX 11.0进行归一化处理。3.应用R语言包对芯片数据进行预处理,以log|FC|≥0.58、P<0.05为标准筛选差异表达的基因。4.利用生物学信息注释数据库DAVID对差异表达的DEmRNA进行GO生物学过程富集分析和KEGG通路富集分析5.在R语言中,应用UCSCXenaTools包下载TCGA数据库中胃癌及癌旁组织mRNA、miRNA、IncRNA数据,验证部分差异表达的mRNAs、miRNAs和IncRNAs。6.应用在线的预测工具miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/)、Target-Scan(http://www.targetscan.org/)n miRDB Chttp://www.mirdb.org/iniRDB/star Base(http://starbase.sysu.edu.cn/)检索miRNA耙向的mRNA。将重叠基因定义为DEmiRNA靶向的DEmRNA。DElncRNA-DEmiRNA相互作用以DIANA-LncBase(http://carolina.imisa.thena-innovation.gr/diana_tools/web/index.php)数据库预测。7.借助Cytoscape软件,构建胃癌IncRNA-miRNA-mRNA ceRNA网络,根据cytohubba计算ceRNA调控网络中各节点degree得分,筛选关键基因(hub基因)。8.利用OncoLnc数据库(https://www.oncolnc.org/)X寸hub基因的表达水平与胃癌患者生存率作Kaplan-Meier生存分析和Log-rank检验,筛选出与胃癌预后相关的hub基因。研究结果:1.根据芯片结果,共筛选出了10个差异表达的微小RNA(DEmiRNA)、766个差异表达的信使RNA(DEmRNA)和110个差异表达的长链非编码RNA(DElncRNA),其中miRNA上调表达3个,下调表达7个;mRNA上调表达403个,下调表达363个;IncRNA上调表达42个,下调表达68个。2.MLK7-AS1、SPP八双ZLF7、hsa-miR-1307-3p等基因在胃癌组织中表达明显增高,MT24、M77X等基因在胃癌组织中表达显著降低。3.12个G0生物学过程,主要在生物学过程(biological process,BP)中显著富集,差异基因富集的KEGG通路主要为矿物吸收的通路。4.确定了前20个hub基因,其中miRNA5个,mRNA15个,分别为miR-3180-5p、miR-183-5p、miR-873-5p、miR-1910-3p、miR-182-5p、MBiVLi、CHST1、HSP90AA1、PRKCB、ZNF827、SPIN4、CA12、MEF2C、AKAP11、ERI2、BCL11A、ELK3、EPDR1、RAB30、K1F2A。5.CHST1与患者的生存负相关,其表达量越高患者的生存时间越短;miR-183-5p与患者的生存正相关,其表达量越高患者的生存时间越长。结论:1.MLK7-AS1、SPPi、SMK/、hsa-miR-1307-3p等基因在胃癌组织生物芯片中高表达;MT2A、MT1X等基因在胃癌组织生物芯片中低表达。2.C7iS77、miR-183-5p与胃癌患者预后密切相关,CHST1与患者的生存负相关,其表达量越高患者的生存时间越短;miR-183-5p与患者的生存正相关,其表达量越高患者的生存时间越长。3.这几个基因可能在胃癌的发生发展过程中扮演着至关重要的角色,可以为将来的基础研宄以及胃癌的早期诊断、预后判断、靶向治疗提供一个新的思路。