论文部分内容阅读
简单重复序列(Simple sequence repeat,SSR)普遍存在于真核生物和原核生物的基因组序列中,以前SSR被认为是基因序列中的“junk DNA”,不具有生物学功能,然而,随着研究的深入发现,SSR的突变率很高,且具有非常重要的生物功能,目前已发现的弗里德赖希共济失调等20多种疾病均是由SSR在DNA序列中扩增造成的。乙型肝炎病毒(Hepatitis B virus,HBV)是目前已知的感染人类最小的双链DNA病毒,它能够引发急慢性肝炎,同时也会显著地提高肝硬化、细胞性肝癌等重症肝病的发生率。HBV具有非常高的突变率,根据HBV-DNA的异质性,将HBV分为八种基因型(A-H)和多种基因亚型,研究表明,不同的基因型/基因亚型在地理分布、致病性、DNA序列突变、对药物治疗反应等方面均存在差异性,目前发现C2基因亚型的致癌性最强,C1基因亚型次之,B2基因亚型再次之。HBV的基因型/基因亚型为研究SSR在基因序列中的变异、进化和功能提供了很好的条件。本论文以C2、C1、B2基因序列为材料,分析SSR在C2、C1、B2基因序列中分布的特点。结果显示,四型SSR、五型SSR、六型SSR并没有在分析的序列中出现,然而,一型SSR、二型SSR、三型SSR在每条分析的序列中均有出现,但其重复次数比较小和序列长度比较短,以上结果可能与HBV-DNA序列非常短和其突变率非常高有关;一型SSR (A)n和(T)n在序列中的含量远比(G)n和(C)n在序列中的含量高;二型SSR (TG)n和(AC)n在B2基因序列中的含量远大于其在C2、C1中的含量,(CT)n是此三种基因序列中最普遍的二型SSR,(AG)n和(TA)n在C2、C1、B2基因序列的含量比较相似;总体上分析发现,与B2基因亚型相比,二型SSR在C2和C1中的分布更相似;(AGA)n和(CCT)n在基因序列中的含量最丰富,且其在各序列间的波动最小,除(AGA)n和(CCT)n外的其它的三型SSR在序列中的含量非常少且波动性较大。总体上,一型SSR在序列中的分布按照C2、C1、B2的顺序减少;二型SSR和总的SSR在序列中的分布是按照C2、C1、B2的顺序增加的;然而,三型SSR在基因组序列中的分布与C2、C1、B2的顺序之间没有明显的相关性。