论文部分内容阅读
目的:本论文拟以循证和生物信息学技术为手段,以当前研究较为深入但存在循证研究盲区的UGT2B7基因多态性位点功能为切入点,进行如下两部分研究:首先利用循证的手段,通过文献检索,开展UGT2B7基因多态性对肿瘤发病风险影响的评估研究;随后根据循证的研究结果,将热点肿瘤作为后续生物信息学的分析对象,进一步探索分析其关键致病基因及重要通路。期望藉此明确UGT2B7基因多态性对肿瘤发病风险的影响,同时,认识了解相关肿瘤的分子机制,为其新的防治标志物的识别提供一定的理论基础。方法:(1)基于循证手段的UGT2B7基因多态性作为肿瘤风险预测标志物的评估研究:我们以“UGT2B7”和“肿瘤”为检索词,检索Pub Med、EMBASE、Cochrane library、中国知网(CNKI)、维普(VIP)和万方数据库查找所有符合条件的研究。根据纳入标准筛选出符合条件的文章,并对其进行了全面审查,收集所有可用的数据。使用比值比(ORs)和95%置信区间(CI)来对结果进行分析。数据的分析处理由Review Manager 5.3软件进行。(2)基于生物信息学分析手段的结直肠癌(CRC)关键致病基因及相关通路筛选研究:从GEO数据库(NCBI-GEO,https://www.ncbi.nlm.nih.gov/geo)下载数据集GSE8671、GSE22598、GSE41328和GSE110224。用Rstudio软件(版本3.6.0)对4个数据集进行处理,之后,用韦恩图筛选出4个数据集中表达模式一致的基因。Rstudio软件(版本3.6.0)和KOBAS在线工具(版本3.0,http://kobas.cbi.pku.edu.cn/)用于差异表达基因的基因本体论(GO)富集分析和京都基因与基因组百科全书(KEGG)通路分析。用基因相互作用的搜索工具(STRING,https://www.strin g.db.org/)和Cytoscape软件(版本3.7.1)进行蛋白质-蛋白质相互作用构建(PPI)、关键基因的识别和模块分析。由最大团中心性(MCC)、最大邻居连通密度(DMNC)、最大邻居连通度(MNC)和蛋白质连接的紧密度(Degree)4种统计学方法筛选关键基因。最后,关键基因的表达验证和生存分析由基因表达谱交互分析在线工具(GEPIA,http://gepia.pku.cn/index.html)完成。结果:(1)共纳入13项研究,包含7688例肿瘤患者和11281名对照。最终结果表明UGT2B7rs7439366、rs7435335和rs12233719多态性与肿瘤发病风险无关。但亚组分析显示,rs7479366多态性在显性模型中与结直肠癌发病风险存在显著关联。(2)CRC的4个基因表达谱数据集中共有196基因表达模式一致,其中59个上调,137个下调。上调基因主要被富集在细胞外基质中,与细胞因子-细胞因子受体相互作用、趋化因子信号通路等有关。下调的基因主要被富集在细胞顶端和根尖质膜,主要与代谢途径、矿物质吸收、胆汁分泌等通路有关。基于4种统计学方法,我们筛选出了11个关键基因。关键基因的表达模式与GEPIA数据库中的表达模式一致,生存分析结果显示趋化因子(C-X-C motif)配体3(CXCL3)和组织抑制剂基质金属蛋白酶1(TIMP1)与结直肠癌患者总生存期相关。此外,根据模块分析结果,趋化因子(C-X-C motif)配体1(CXCL1)、趋化因子(C-X-C motif)配体8(CXCL8)、基质金属蛋白酶-10(MMP10)和几丁质酶3样蛋白1(CHI3L1)与关键基因紧密关联。结论:(1)UGT2B7 rs7439366可能与结直肠癌的发病风险有关,该多态性有望成为结直肠癌风险预测的潜在生物标志物。(2)基于生物信息学分析,我们筛选出了CRC的11个关键致病基因和相关通路。CXCL3和TIMP1与CRC患者的总体生存期有关。