论文部分内容阅读
流感病毒是一种RNA负链病毒,在世界各地引发季节性流感,严重时引起全球范围内的流感大流行。将动态的基因表达谱数据和静态的蛋白质相互作用网络进行整合分析的方法得到快速发展,更适合分析具体的生物医学问题。借助差异表达基因获得生物标记物方法表现不佳,而以差异通路作为生物标志物的方法则能提高稳定性和准确性。借助对生物通路之间的相互作用的分析能够从新的角度认识疾病过程。首先,我们以GSE27131人感染H1N1的样本为原始数据,对SAMVB、GSEA、主成分分析、Bioconductor、及基于通路相互作用网络筛选差异通路的方法(PIN)的准确性进行比较。其中,SAMVB,PCA和Bioconductor三种方法以统计学为基础,而另两种方法融合了更多的生物学知识。通过标准数据集方法进行比较验证,可知PIN方法的准确性最高为80.6%,而敏感性也较高,为81.3%;以交叉验证的方法进行可靠性分析,获取ROC的曲线下面积,PIN方法具有最大的ROC曲线下面积,即相比较具有最高的可靠性。随后,我们从GEO数据库中筛选出鸡感染禽流感的四组数据。分别为GSE32378,鸡感染H5N1;GSE31476,鸡感染H1N1;GSE31505,鸡感染H9N2;GSE31506,鸡感染H5N2。选取PIN方法进行差异通路和差异表达基因的预测,并对这些差异表达基因进行染色体定位、GO注释富集分析,映射到蛋白质相互作用网络进行分析。可知筛选四个数据集得到的差异基因,在染色体定位分布上有较小差异;在GO注释富集分析中差异较小;蛋白质相互作用网络的拓扑分析结果显示,四组数据中获得的hub蛋白不同,其对应得到的重要基因也不同;在通路相互作用网络分析中,不同的流感感染过程重要的基因也不同。鸡感染H1N1和H5N2过程中有共同的重要基因CBL和GOT1;鸡感染H9N2和H5N2过程中有共同的重要基因ATP2A2。由我们的统计结果显示,在鸡感染这四种禽流感病毒的过程中,核糖体、氧化磷酸化、嘌呤代谢、Wnt信号通路、TGF-β信号通路及Jak-STAT信号通路都起到了重要的作用。最后,我们还从GEO数据库中选择人、猪、鸡感染H1N1三组数据,分别为GSE31524,人感染H1N1;GSE35738,猪感染H1N1;GSE31476,鸡感染H1N1。采用上面4组数据同样方法分析处理,可知筛选获得的差异基因在生物过程、分子功能及细胞组成的GO注释富集分析中差异较大;蛋白质相互作用网络的拓扑分析其hub蛋白不同,其对应得到的重要基因也不同;针对通路相互作用网络分析,不同的物种感染H1N1流感过程连接多条通路的重要基因也不同,但MAPK信号通路和Jak-STAT信号通路在H1N1的感染中起着重要的作用。