论文部分内容阅读
微卫星序列(Microsatellite)是一类以2~6碱基为重复单元的DNA或RNA重复序列,也被称为简单重复序列(Simple Sequence Repeats,SSR)。微卫星序列在真核生物和原核生物基因组中的非编码区、编码区、基因间区都有广泛分布。微卫星序列具有高度的突变性及多样性,因此微卫星序列作为一.种分子标记在身份识别、亲子鉴定以及种群或个体间基因相关性分析等应用中被广泛使用。除了作为分子标记以外,微卫星在生物体中还起着重要生理作用,40多种人类先天性疾病均由微卫星重复数量改变而引起。目前微卫星的研究主要集中在原核生物与真核生物,在病毒基因组中的研究还非常有限。非典冠状病毒(Severe Acute Respiratory Syndrome-Related Coronavirus,SARSr-CoV)在 2002~2003年间引起了全球性的非典型性肺炎大爆发,在37个国家中发生了774例死亡。SARSr-CoV以蝙蝠为天然宿主,在2002年底通过果子狸为中间宿主感染到人,最终导致SARSr-CoV在人群之间的爆发传染,爆发时间之短,传染速度之快,可能与微卫星对物种快速适应环境的作用有所关联。本文利用现存数据库中感染蝙蝠、果子狸及人类的SARSr-CoV基因组数据,从微卫星的角度,结合统计学,计算机方法,进行微卫星分布综合分析。本文主要有以下两个方面的内容:SARSr-CoV全基因组序列中微卫星序列的分析(第2章)本研究从NCBI的Genbank数据库中下载165条SARSr-CoV,依其感染宿主不同分为三组,感染蝙蝠、果子狸以及人类的SARSr-CoV序列,经过分析得到以下结果:(1)SARSr-CoV基因组序列相似程度高,感染不同宿主的SARSr-CoV进化时间短,且微卫星长度普遍偏短,同样映射出病毒进化时间短(2)组间微卫星的数量分布具有差异性。(3)除了数量之外,不同重复单元类型的微卫星差异更大。其中主要差异体现在一型微卫星中,说明一型微卫星可能是推动进化的关键。而二型微卫星十分稳定,说明二型微卫星可能起到重要的生理作用,三型微卫星人类与果子狸高度一致,而蝙蝠与他们均有较大不同,且存在其独有的微卫星,说明非典可能是由大量不同的蝙蝠SARSr-CoV中的一小个种群进化而来,而蝙蝠体内大量进化各异的SARSr-CoV为跨宿主传播做好了充足的准备。SARSr-CoV中微卫星序列的宿主差异性分布分析(第3章)在第2章中对SARSr-CoV基因组序列中微卫星的数量与类型做了分析,但其分析是在平均和整体的水平上,无法得到基因组上微卫星分布的细节信息。在第3章中,使用本研究组开发的C++软件,对三组感染不同宿主的SARSr-CoV进行进一步的分析,得到SARSr-CoV基因组不同区域中的微卫星序列分布模式图,并从其中找出微卫星分布具有宿主特异性的区域,随后定位到相应的微卫星宿主特异性位点,这些位点可能对S ARSr-CoV的短期快速跨宿主进化的工程中起着重要的推动作用。结果显示,微卫星在基因组不同位置上是非随机分布的,微卫星在病毒基因组上的分布存在位置偏好性,且在感染不同宿主的SARSr-CoV中微卫星在基因组同一区域上的分布是存在差异的。(1)一型微卫星多数分布在S基因区域,且有明显的宿主特异性,在S基因区域的微卫星位点上,蝙蝠SARSr-CoV中不存在一型微卫星,果子狸SARSr-CoV中存在一部分完美微卫星与一部分非完美微卫星,而人类SARSr-CoV在此位点全都存在完美微卫星。S基因表达的相关蛋白在病毒入侵细胞时起到受体识别以及溶细胞膜作用,与病毒的感染能力息息相关。(2)二型微卫星多数分布在ORF1ab基因区域,且三组病毒在相同区域内二型微卫星没有很大的数量差异,此区域负责生产病毒正常生理过程中所需的RNA解旋酶,RNA聚合酶以及蛋白酶等重要物质,为了保证病毒个体的存活,此区域必须保守,因此二型微卫星在此区域没有发生较大的突变。(3)三型微卫星在人类/果子狸的各个区域内的存在与数量相当,而蝙蝠病毒三型微卫星在基因组区域上的分布更为分散而平均,推测三型微卫星在进化过程中受到的选择压力较小,因此三型微卫星可以为蝙蝠SARSr-CoV群体提供丰富基因库,丰富的基因库为蝙蝠SARSr-CoV跨宿主传播提供了可能。