论文部分内容阅读
人类基因组计划完成之初,人们在非编码序列中发现大量的重复序列。目前越来越多的研究表明重复序列是基因组的重要组成部分,它参与了基因的表达和生物的生长发育过程。微卫星作为重复序列中比较简单的一类,因和多种人类神经系统疾病相关而引起重视,后来被应用于分子生物学研究的多个领域。微卫星的研究从真核生物逐步扩展到原核生物,近年来,才开始涉及到病毒领域。噬菌体是一类数量丰富、存在较久远的细菌病毒,是生物医学研究的模式生物之一,被广泛应用于治疗一些由细菌引起的疾病且不会对人体正常细胞造成伤害。本论文利用现有的数据库中的序列信息,以微卫星为侧重点,借助生物学、统计学、和计算机方法对噬菌体基因组中的重复序列进行分析。为了解病毒的进化过程和致病机理提供理论分析。 本论文内容主要涉及以下两个方面: 1.T4噬菌体(T4-like viruses)基因组中微卫星和复合型微卫星分析(第2章) 在本章中我们选择了噬菌体尾病毒目中的T4属的67条序列为样本,分析了其中微卫星和复合型微卫星的发生和分布模式。研究发现T4噬菌体中微卫星的相对丰度和相对密度与基因组较小的动物病毒和植物病毒相比,波动范围相差不大,复合型微卫星的发生率略低于所比较的五种病毒。为了进一步评估基因组相对较大的T4噬菌体微卫星发生是否属于偶然,我们用C语言生成了和下载序列(参考序列)具有相同碱基组成和基因组大小的随机序列来评估微卫星发生率。结果表明噬菌体中微卫星发生率虽然显著低于相应的随机序列,但微卫星对三碱基重复具有特定的偏好性。皮尔逊线性相关分析表明基因组大小与微卫星和复合型微卫星的发生率存在显著的正相关。基因组中GC含量稍低于AT含量,但重复序列中的A/T含量却占了绝大部分,这可能是序列中较多的A/T聚集在一起比较容易形成发夹结构从而调控遗传信息的表达。复杂程度显著影响了复合型微卫星的数量;随着dMAX(相邻微卫星之间的距离)的增加,复合型微卫星数量也在缓慢增加。虽然T4噬菌体基因区较长,相对丰度表明较多的复合型微卫星出现在了保守性相对较低的基因间区。对T4噬菌体基因组中重复序列的研究有助于我们更好的理解T4噬菌体基因组的遗传多样性和生物进化。 2.噬菌体与疱疹病毒中的微卫星差异分析(第3章) 我们在第2章发现微卫星在T4噬菌体中的发生率明显低于长度一致的随机序列。通过查阅文献发现疱疹病毒和噬菌体一样,是一类基因组相对较大的病毒,且衣壳蛋白的结构相似性表明这两种病毒在起源上比较接近,可能存在共同的祖先。因此,我们从整个疱疹病毒目和尾病毒目中各选取46条基因组序列依长度编号,使编号对应的序列长度尽可能接近。结果表明噬菌体中的微卫星发生率显著低于相应的疱疹病毒。曲线拟合分析表明:GC含量在同一生物中对微卫星发生率存在显著影响,GC含量偏高或偏低,都会使重复序列的发生率大大增加。在不同生物中,GC含量一致的情况下,噬菌体中的微卫星含量比疱疹病毒中低了大约一倍。进一步分析表明,这种差异主要来自序列自身。疱疹病毒可能和宿主存在共同进化,出现了类似真核生物中心粒和端粒结构的中间重复区域和末端重复区域,这些区域存在大量的重复序列。另外我们发现噬菌体中的GC含量与宿主基因组的GC含量存在趋同的趋势,这为进一步证明噬菌体和宿主间的共同进化提供了依据。本章通过微卫星分析表明存在共同起源的生物在进化过程中由于选择的宿主不同,和宿主存在共同进化导致基因组朝着不同的方向进化。这为进一步研究病毒的进化过程提供了帮助。