论文部分内容阅读
转座元件也称为转座子,是一类具有跳跃能力的DNA序列。这类序列广泛分布在动植物基因组中,是基因组的主要组成部分,通过多种方式转座至基因组的其他位置从而影响下游基因表达或产生新的基因组片段,是产生变异的重要途径之一。研究转座子的特点和功能有助于认识基因组成分,并了解其在物种进化中发挥的作用。小麦中国春是异源六倍体物种,基因组庞大且主要由转座子构成,全基因组序列的获得加速了对转座子的认识,从而进一步了解小麦基因组的特征和功能以及进化过程中的多样性和保守性。中国春种植广泛,适应性强,是当前主要的粮食作物,对基因组成分的深入研究对进一步提高产量和改良品质具有重要意义。本研究比较了已有的计算分析方法,对小麦中国春基因组中的转座子进行了注释和综合分析。利用序列同源性的原理,将转座子文库中的序列和参考基因组比对,整合位置信息对中国春基因组进行转座子注释。结果发现,转座子在基因组中所占比例约为80%,主要由Gypsy,Copia,CACTA三类转座子组成。不同的亚基因组之间比较,转座子的类型和含量呈现相似的分布,总体上A亚基因组中的转座子含量较高,D亚基因组中转座子含量较低。基因组中大于90%的转座子分布在基因间区,使得重要基因不受影响正常表达;但仍有部分转座子分布在基因上游或基因内部。并且注释了小麦基因组中的微型转座元件,数量较少,倾向于分布在基因附近。根据反转录转座子的结构特征和序列计算进化过程中各家族转座子的插入时间。结果表明Gypsy的插入时间早于Copia,整体上染色体两端的转座子更年轻。对祖先种的二倍体,四倍体小麦使用上述方法进行全基因组转座子注释,发现在六倍体中各亚基因组与祖先种中的转座子含量和类型相比没有显著差异。研究从转座子改变基因组结构和调控基因表达两方面探究了转座子的功能。Gypsy和Copia具有相似的3’转导(3’transduction)能力,使下游序列复制在基因组多个位置推动基因组进化。根据表观遗传学特征,基因组按照不同的染色质状态被分为15个类型,转座子富集到H3K9二甲基化和H3K27三甲基化表观遗传标记,并具有较高的DNA甲基化水平,其中受到H3K27三甲基化修饰的转座子倾向于分布在基因附近。通过以上的分析,本研究得到了中国春及其祖先种基因组中转座子的注释结果。与祖先种相比较,转座子在各基因组中含量和类型基本一致。不同家族的转座子结构特征不同,靶基因功能也不同。转座子在进化过程中主要经历了序列突变和片段丢失,基因组整体的转座子在多倍化过程中没有较大改变。六倍体小麦中大部分的转座子受到了多种组蛋白修饰和DNA甲基化的抑制,与其功能密切相关。生物信息学方法作为重要的研究手段,实现了在全基因组范围的大规模分析和多组学数据的整合分析。了解转座子的特征对研究其相关的生物学过程及功能来说是至关重要的基础研究。