论文部分内容阅读
人体内寄居着大量的各种类型的微生物。我们对这些人体微生物的认识,包括人体微生物之间的相互关系以及人体微生物与人体健康之间的关系,尚处于初始阶段。人体微生物组计划发布的人体微生物基因组序列为我们认识和研究人体微生物提供了重要资源。本研究在全面预测了308种人体微生物基因组中横向转移基因的基础上,通过分析人体微生物组中横向基因转移事件来全面的认识人体微生物及其之间的相互关系。人体微生物之间以及人体微生物与外界微生物之间发生着频繁的横向基因转移事件;人体微生物的横向基因转移事件与微生物的数量密切相关;发生横向转移的基因在催化与代谢功能上有富集。最后,我们基于人体微生物之间的横向基因转移事件构建了人体微生物相互作用网络,尝试着从整体上认识和分析人体微生物之间的相互关系。我们的研究结果表明,人体微生物环境有助于微生物横向基因转移事件的发生,研究人体微生物组中横向基因转移事件有助于我们研究人体微生物与人类健康之间相互关系。 预测微生物基因组中横向转移基因的方法有两类,谱系关系法(phylogeneticapproach)和序列特征法(composition-based approach)。在应用这两类方法预测人体微生物中的横向转移基因的过程中,我们发现基于序列特的征预测方法有可以改进的地方。现有的系列特征法分别考虑GC content,dinucleotides,codon usage,tetranucleotides等序列特征。我们设计了一种新的序列特征法—综合参数法,来预测微生物基因组中的横向转移基因。在综合参数法中,每个基因含有单碱基使用频率(A,T,C,G),双碱基使用频率(AA,AT,AC,……,TT),三碱基使用频率(AAA,AAT,……,TTT)等序列特征。在使用这些参数预测横向转移基因的过程中,我们发现同时使用单碱基,双碱基,三碱基,四碱基使用频率等7个特征的时候,能获得最好的预测效果。而且,综合参数法比以前报道的序列特征方法的预测准确性更高。我们利用综合参数发预测了308种人体微生物基因组中的横向转移基因,并将预测的结果储存在HMP-HGTdb数据库中(http://www.bioinfostudio.org/hgt)。 在研究人体微生物组的过程中,比较不同微生物群落的差异一直是很重要的问题。例如,人体不同部位寄生着的微生物群落是否相似,不同个体携带的微生物群落是否相似,这些问题吸引了广泛的研究兴趣。现在应用最为广泛的方法是UniFrac,它是一种根据遗传距离计算beta多态性的方法,能较为精确反映出微生物群落之间相似性大小。与Unifrac的思路不同,我们设计了一种专门用来比较微生物群落差异大小的方法-VCOM,该方法充分考虑到不同微生物物种之间的遗传距离以及每个微生物物种的丰度,能精确的计算出群落差异的大小。UniFrac方法相比,VCOM法具有同样的准确性,但是计算过程更为简洁快速。