论文部分内容阅读
重复序列是真核生物基因组中的重要组成部分,并以多拷贝形式而出现的核酸序列,对基因遗传变异、转录调控和物种进化等方面具有重要的意义。重复序列的结构特征和进化关系在模式动物、人类、植物等物种中都有报道,但在牛亚科物种中研究较少。本研究旨在揭示牛亚科物种重复序列特征,研究转座子和串联重复序列的进化关系,为牛亚科物种重复序列的研究提供理论支撑。本文以普通牛、瘤牛、牦牛、水牛、野牛、大额牛六个牛亚科物种为研究对象,采用比较基因组学对它们的基因组序列进行分析,研究了串联重复序列和转座子在六个牛亚科物种中的结构特征和分布,以及两者之间在基因组中的进化关系等,结果如下:1.通过鉴定六个牛亚科基因组中重复序列,得到重复序列在普通牛中的含量最高,为49.13%,其次为水牛46.82%、大额牛46.66%、瘤牛42.70%、野牛42.36%、牦牛42.34%。其中转座子在基因组中的含量在40.57%-45.71%之间,高于串联重复序列的含量(1.50%-3.42%)。2.在串联重复序列分析上,采用TRF和RepeatMasker软件鉴别了六个牛亚科基因组中的串联重复序列,其在基因组中所占比例由高到低分别为:普通牛(3.42%),大额牛(2.10%)、水牛(1.96%)、牦牛(1.77%)、野牛(1.50%)、瘤牛(1.42%)。六个牛亚科物种中总位点的平均数为564,611,其中微卫星的总位点数为483,405(85.64%),高于小卫星(43,026,7.62%)和卫星序列(38,180,6.75%)。此外,通过构建两种类型(1.715和1.723)的着丝粒卫星序列系统发生树,发现该序列虽然可以同时存在六个牛亚科物种中,但是在物种间或不同染色体上存在不同程度分化。3.在转座子分析上,采用RepeatMasker软件鉴别了六个牛亚科基因组中的转座子,在基因组中所占比例由高到低分别为:普通牛(49.13%),其次为大额牛(46.66%)、水牛(46.23%)、瘤牛(42.70%)、牦牛(42.53%)、野牛(42.36%)。其中非长末端重复(non-LTR)所占比例为37.16%,包括LINE(25.88%)和SINE(11.28%),而LTR(3.73%)和DNA转座子(2.10%)的含量较少。此外,通过对转座子的位置信息进行注释,仅有3.06%-8.54%的转座子位于编码区。4.在串联重复序列和转座子之间分析中,通过BLAST比对分析了二者之间的序列相似性,结果表明串联重复序列中有43%-84%的序列来源于转座子,这些转座子主要来自non-LTR(SINE和LINE),其中SINE/Core-RTE(主要为BOV-A2)的数量(14,423-24,193)和相对丰度(4.06%~6.77%)最高,被认为是牛亚科物种中最年轻且最具活力的转座子。另外,转座子的串联重复特征分析表明,BovB和L1_BT转座子序列分别在0~600 bp、1,500-2,700 bp之间发生了大量的串联重复,表明串联重复序列可作为转座子内部结构的组成部分,与转座子在基因组进化过程相互影响、相互作用。