论文部分内容阅读
串联重复序列属于高度重复序列,广泛分布于真核生物和一些原核生物基因组中,包括微卫星和小卫星重复序列,前者的重复单位长度为1-6bp,后者的重复单位长度在7bp及7bp以上。本文希望通过对中国对虾基因组随机测序序列中串联重复序列的分析,了解其在中国对虾基因组中的组成和分布特征,并从中开发一些具有多态性信息的微卫星位点,用于中国对虾的个体和家系识别。本研究的具体内容和结果如下: 1、对中国对虾基因组中的微卫星和小卫星重复序列进行了分析,获得了相当于整个基因组序列1.23‰的2597 000bp的总序列长度,从中找到微卫星重复序列3 888个,小卫星重复序列700个,重复序列总长305 555bp,占总序列的11.72%,其中微卫星序列的累积长度为232 979bp,占序列总长的8.97%,这个比例显著大于人类和按蚊等基因组中微卫星重复序列的比例。各重复序列类型的数目之间的比例情况与它们的长度之间的比例情况基本一致。微卫星重复序列中,两碱基重复类型的数目最多,其次是三碱基,再次是四碱基,其它的依次是单碱基、六碱基和五碱基重复序列类型; 小卫星重复序列中十二碱基重复序列类型的数量最多。不同重复序列类型中的各种重复拷贝类别也不同,如单碱基重复类型中A的重复数目最多; 两碱基重复类型中的是AT,三碱基是AAT等等; 而五碱基重复的数量和重复拷贝类别的数量都比其两侧的四碱基和六碱基都要少的多,进一步的分析发现五、七、十一和十三等由质数数目组成的碱基重复序列类型的重复序列数目和拷贝类别的种类都要比其相邻的重复序列的种类和数量要少,本文对此的初步分析认为,这个现象可能暗示了微卫星和小卫星之间的进化关系,即许多小卫星重复序列是在微卫星重复单位,尤其是1-3bp重复单位的基础上进一步经过重复和突变等过程形成的。在重复序列的数量频率分布上,两碱基重复序列近似成正态分布,而其它类型随着拷贝数目的增加,重复序列的数量则呈逐步减少的趋势。2、从1900个克隆序列中设计了12对具有较高遗传多态性且有稳定扩增产物的微卫星引物。对所有有扩增产物的微卫星核心序列分析表明,具有多态性信息含量的以两碱基重复序列类型为主,同时分析表明重复拷贝数目与相应的等位基因数(即与遗传多态性)呈一定程度的相关,但相关性不显著。