论文部分内容阅读
目的本研究的目的在于利用公共数据库TCGA中提供的前列腺癌RNA-Seq数据,筛选潜在的前列腺癌相关基因和miRNA。通过建立蛋白质相互作用网络,寻找筛选出前列腺癌相关的关键基因,同时建立miRNA和靶基因的调控网络,寻找筛选出前列腺癌相关miRNA,从而扩充前列腺癌分子生物学的知识库,为功能学研究和靶向治疗等提供方向。最后,为寻找评估前列腺癌预后、指导风险分层,制定治疗策略的分子标志物,探索了差异表达miRNA和基因与预后,侵袭特征的临床相关性。方法从TCGA数据库中下载499例前列腺癌组织样本及52例癌旁正常前列腺组织样本mRNA和miRNA的RNA-SEQ数据以及临床数据,通过DESeq程序包分析前列腺癌基因和miRNA的表达谱,获得差异表达的基因(DEGs)和miRNA。对于筛选所得的差异表达基因,利用DAVID数据库进行生物学功能富基分析,使用String数据库获得蛋白质相互作用网络(PPI),并利用Cytoscape中cytoHubba插件分析获得PPI网络中的关键基因。对于筛选所得的差异表达的miRNA,利用miRwalk2.0靶基因预测网站,联合12个权威的miRNA靶基因预测网站,寻找其潜在的靶基因,并与参与肿瘤信号调节的差异表达基因综合分析取重叠,获得参与肿瘤信号通路的差异表达miRNA以及其潜在的靶标,并绘制miRNA与靶基因的网络图。同时利用GEO数据库中miRNA数据集,验证miRNA的差异表达。最后结合TCGA数据库中的临床数据,通过Cox回归分析建立风险预测模型,探索差异表达基因和miRNA与侵袭特征的临床相关性。结果1、共获得2347个DEGs,其中上调的有712个,下调的有1635个。DAVID数据库生物学富集功能显示,DEGs参与肿瘤信号传导等通路。构建PPI后,获得了 7个关键基因。2、共获得差异表达的miRNA 50个,其中上调的有23个,下调的有27个。利用miRwalk2.0在线预测网站,发现了 14个参与前列腺癌信号调节的miRNA和25个靶基因。GEO数据库中的12个数据集验证了 10个miRNA的差异表达,并且为后续研究miR-153,miR-375在前列腺中的调控机制提供方向。3、建立了由 FGF7,LPAR1,miR-3664,miR-5680,miR-5687 组成的风险预测模型,该模型在预测前列腺癌患者存活风险方面具有良好的灵敏度和特异性,可作为可靠的预测前列腺患者预后的生物标志物。4、发现了前列腺癌侵袭特征相关的4个miRNA以及2个mRNA,具有预测前列腺癌风险度的潜能。结论本研究基于TCGA数据库的大样本生物信息数据,分析了前列腺癌相关的miRNA和基因的表达谱,并形成了 DEGs的蛋白互作网络,绘制了 miRNA与靶基因的网络图,发现了与前列腺癌相关的关键基因,miRNA及其可能的靶基因,为后续功能学研究提供方向。并且建立了预测前列腺癌患者预后能力优秀的miRNA-基因模型,发现了部分miRNA和基因显示出良好的临床相关性,可在临床实践中指导前列腺癌的预后评估和风险分层。