论文部分内容阅读
哺乳动物的基因组是由一系列碱基组成相当均匀的大片段(约300 kb)所组成,这种大片段被称之为同质段。研究基因组的同质段结构是了解和认识基因组结构的一个基本问题。近年来,碱基组成的进化问题吸引了众多的学者,除了研究形成这种特殊现象的原因之外,同质段的进化前景也成为了一个研究的焦点。大多数的科学家认为现在的同质段结构已经开始在慢慢消失,但是其它的一些学者认为这是由于一些错误的方法或者有限的数据导致的误差所致。
重组推动了碱基组成的进化,虽然这一主流假说已经被广泛接受,碱基组成的进化机制却还没有被阐明。根据前人的研究,有两个模型最有可能用来解释碱基组成的进化机制:偏向性基因转换模型(the biased gene conversion model,BGC)指出,由于在减数分裂过程中错配的修复机制是偏向于GC,所以在那些GC/AT的杂合位点GC倾向于被固定下来,基因转换的过程使得重组频繁区域的GC含量得到相应的升高;局部偏向性突变模型(the regional mutation biased,RMB)认为,是由于基因组不同区域的GC→AT:AT→GC比例不同,才导致这些区域间的碱基组成差异。重组的致突变性质能够增加AT→GC新突变产生的概率,在中性条件下,如果局部的突变是偏向于AT→GC的产生,那么该区域的GC含量就是增加,反之亦然。有力的证据从各方面支持着偏向性基因转换模型和局部偏向性突变模型,因为BGC模型认为GC有优先被固定下来的优势,而RMB模型则认为碱基组成的进化是中性的,所以可以通过研究进化过程中等位基因的固定是否具有偏向性以及突变是否有偏向性来区分两者在碱基组成进化中的作用。
SNP作为没有固定的突变,与替换相比它更能反映出突变的真实偏好,而它在群体中等位基因的频率又可以反映出固定的趋势。虽然其数量相对于替换较少,但是随着HapMap计划的完成,在人类基因组中已经有数以百万计的SNP被发现并确定了其在群体中等位基因的频率。所以说SNP是一种非常理想的研究同质段进化的材料。
最近一种新的推测SNP位点突变方向的方法被研究出来,且已经应用在人和黑猩猩SNP的分析上面,通过这种方法,我们能够确定更多的SNP的突变方向,这为我们以连续的基因组片段来分析同质段进化提供了条件。按照新公布的人类同质段结构草图,我们第一次以同质段为单位研究了同质段的进化。通过从突变和固定两个角度来分析,我们发现突变正在摧毁现有的同质段结构:高GC区突变偏向GC→AT的突变,而低GC区则偏向AT→GC的突变,除了由于各同质段碱基组成不平衡外,CpG位点也被认为其了重要的作用。而固定发挥的作用则和突变的相反,在高GC区,AT→GC的突变相对于低GC区更容易被固定下来,值得注意的是,在任何GC含量的同质段内,AT→GC的突变相对于GC→AT的突变都更容易被固定,这应该是归功于BGC效应,此外我们还发现随着GC含量的升高,所有的突变都有更容易被固定的趋势。综合这两种相反的效应,我们发现旧的同质段在消失,一个更加同质化GC含量更高的新的结构正在形成。而在这个过程中,同质段所包括的CpG位点、基因区位点都起了巨大的作用。同时,通过对重组热点和冷点突变和固定模式的研究,我们发现重组是促进GC固定,避免AT固定的主要原因,在重组很少发生的冷点,我们没有观察到AT→GC与GC→AT两种突变存在固定上差异,此外,虽然它有促进更多AT→GC突变产生的趋势,但是并不明显。