论文部分内容阅读
从生物学的角度来说,疾病是影响人类和其它生物的一种特殊的表型。疾病的发生和发展通常是一个复杂的过程,其涉及到多基因之间的协同作用,而这种多基因之间的协同作用是很难通过传统的生物学方法进行检测。近年来随着高通量实验技术的进步,各种不同的“组学”数据的不断涌现,为研究生物表型发生发展的分子机制提供了机遇。而研究模式也从以往只关注单个分子的行为扩展到考察分子之间形成的相互作用网络的动态变化。作为系统生物学中的核心工具,分子网络系统整合了大量生物学知识和前人研究的结果,是研究很多复杂问题的强有力的工具。本文以分子网络为主要工具,并结合基因表达数据,对表型相关的基因进行研究。通过对禾谷镰刀菌引起的作物病害和人类胃癌两种不同的表型进行分析,由关注分子网络上的点的表达变化到关注分子网络的边的动态变化,提出了新的算法,并预测了表型相关的基因,本文的工作主要集中在以下三个部分:(1)提出了一种基于基因表达数据和分子相互作用网络的系统生物学方法,预测了潜在的禾谷镰刀菌的致病基因。该方法利用一小部分己知的致病基因,以及从禾谷镰刀菌的蛋白相互网络中标识出可能的包含致病基因的潜在致病子网络,在致病子网络中的差异表达基因随后被选出。进一步研究发现致病子网络中的基因与己知的致病基因参与共同的生物过程,因此是潜在的致病基因。并通过文献分析发现,我们预测的部分致病基因己经被报道。(2)提出了一种新颖的方法,基于差异的分子相互作用预测复杂疾病相关疾病基因和疾病模块。相比其它基于基因和蛋白差异表达的方法,我们的方法注重分子相互作用网络在正常和疾病状态之间的差异。并且,我们以一个包含不同阶段的胃癌表达数据作为例,预测了胃癌的相关的疾病基因模块。最终,我们标识出一个胃癌相关的网络模块,通过统计分析发现,我们发现该模块中富集了胃癌相关的基因。并且通过验证可以看出,我们标识出的网络模块是一个诊断胃癌的有效生物标记。(3)开发了一个禾谷镰刀菌的整合数据库(eFG),为了进一步更好的研究这个破坏性病原真菌而服务于禾谷镰刀菌的研究社区。在eFG数据库中,各种组学的数据被收集到一起,包括:禾谷镰刀菌的基因组数据、功能注释数据、生物途径数据等。特别是,来自本研究组的一些非常有价值的推导自功能基因组的数据同样被导入eFG数据库,这些数据包括:禾谷镰刀菌蛋白的亚细胞定位、蛋白-蛋白相互作用、以及在其它真菌中的直系同源基因等。目前,eFG数据库已经建立了一个友好的用户界面,并可以通过网址:http://csb.shu.edu.cn/efg/进行访问。该数据库为破坏性病原真菌禾谷镰刀菌的研究提供了重要资源。