论文部分内容阅读
微型反向重复转座子(MITE)是由Bureau和Wessler首次在玉米中发现并命名的。在随后的研究中发现MITE广泛分布于真核生物基因组中。家蚕作为鳞翅目昆虫的代表,全基因组测序已于2004年完成,并在2008年,由中日科学家合作完成了家蚕基因组精细图的组装。与此同时日本科学家Osanai-Futahashi等人在分析家蚕基因中转座子含量时,发现转座子序列约占整个家蚕基因组的40%。虽然他们发现家蚕基因组中含有丰富多样的转座子序列,但是对于MITE转座子的信息却一无所知。转座子构成了高等生物基因组的大部分并且其在不同生物基因组中的含量有非常大的变化,因此,探明转座子的进化动力学对于理解高等生物基因组的进化有非常重要的意义。转座子的进化动力学在少数物种特别是在果蝇和拟南芥中已有较深入的研究。但是,所有已有的研究结果都是基于少数模式生物和相应自然群体获得的,对驯化物种中转座子的进化动力学研究仍然是一个空白。毫无疑问,这类研究无论对于理解驯化物种的驯化遗传学还是对于理解真核基因组的进化都有非常重要和普遍的理论意义。MITE转座子广泛的分布在真核生物的基因组中。目前对于MITE转座子种类、含量、分布和转座机制都有深入的研究和清晰的认识。但是对MITE转座子在基因组中的功能研究同样处于空白状态。本文应用MUST软件以及一系列生物信息学方法和软件对家蚕基因组中的MITE转座子进行鉴定,分类,分布和进化分析;通过转座子显示技术、群体遗传学理论和方法以及生物信息学方法对家蚕转座子的进化动力学进行研究;借助转基因技术,细胞转染技术和常见的分子生物学手段探测家蚕BmMITE-2转座子对邻近基因表达的调控。主要研究结果如下:1.家蚕基因组中MITE转座子的种类、含量和序列结构特征应用MUST软件对家蚕全基因组进行扫描并经过一系列筛选程序,一共鉴定了17个MITE家族,命名为BmMITE-1到BmMITE-17,这些家族在家蚕基因组中一共含有5785个拷贝,约占整个家蚕基因组的0.4%。它们的TSD长度在2到9bp之间、TIR长度在8到59bp之间、序列全长在210到567bp之间。根据它们的TIR和TSD序列进行同源性注释发现,这17个家族中有3个(BmMITE-4,5,6)属于Tourist-like家族;3个(BmMITE-2,3,8)属于Stowaway-like家族;4个家族(BmMITE-13,14,15,16)属于Pegasus-like家族,剩下的7个家族(BmMITE-1,7,9,10,11,12,17)属于新的家族。2.家蚕MITE转座子的扩增情况为了估计这些MITE转座子在家蚕基因组中的扩增情况,我们分别对这些MITE转座子进行了插入时间估计、Network分析家族内部的序列分化度和滑窗分析各家族内全长序列不同区域的分化度。插入时间分析结果表明:不管是在家族间还是在家族内,家蚕MITE转座子插入时间都有很大的变化,它们的插入时间范围在0到4个百万年内,并且这17个MITE家族的插入时间主要发生在2个百万年内。一个有趣的结果是BmMITE-2转座子在0-1个百万年内可能发生过爆发式的扩增,并且在很短的时间内其拷贝数增加了2173个;Network的分析结果显示:家蚕的17个MITE家族中有8个家族(BmMITE-4、BmMITE-6、BmMITE-7、 BmMITE-1、BmMITE-14、BmMITE-15、BmMITE-16和BmMITE-17)可能是在很久以前发生的扩张,剩下的9个家族可能经历了最近的扩张,这一分析结果和插入时间估计的结果是一致的;滑窗分析的结果发现:除了6个MITE家族(BmMITE-4、BmMITE-5、BmMITE-9、BmMITE-12、BmMITE-14和BmMITE-15)只有一端的TIR比较保守,剩下的11个家族在序列两端的TIR区域都相对较保守。因为TIR是MITE转座过程中转座酶的识别位点,所以TIR的保守也反映出这些家族可能最近具有活性并发生了扩张。3.家蚕MITE转座子在染色体和基因附近的分布情况所有的MITE广泛分布于家蚕的28条染色体上,并且这些MITE在28条染色体上的分布并不是随机分布的(Chi-square=297, df=27, P<0.01),特别是在其中7个染色体上(2号、16号、20号、24号、26号、27号和28号染色体)实际观察值要显著的高于期望值。进一步探测这些MITE转座子在基因附近的分布情况时发现:5785个鉴定的MITE转座子中有3794个(66%)分布在基因的附近。其中有962个(25%)分布在基因的5’端侧翼区域(<5kb)、有60个(2%)分布在外显子区域、1427个(38%)分布在内含子区域和1343个(35%)分布在3’端侧翼区域(<5kb)。这一结果表明MITE在内含子和两个侧翼区域的分布要显著高于外显子区域。4.主要家蚕转座子家族在家蚕群体和野桑蚕群体中的转座子显示数据和群体多态性为了研究转座子在家蚕驯化过程中的进化动力学,我们不仅选择了两个代表性MITE(BmMITE-7和BmMITE-2)而且还选择了另外5个其它转座子家族(Bml, Pao、CR1、Jockey、Bmmar1、),应用转座子显示技术比较这些家族在4个家蚕群体(中系、日系、欧系和热带品系)和1个野桑蚕群体中的多态性分布情况。结果表明:(1)几乎所有转座子在家蚕群体中的平均的多态性条带频率(MPBF)、每个群体中每个个体的平均条带数(MTB)和群体内固定了的条带数(Sf)都显著高于野桑蚕群体中的相应数;(2)有11个家蚕群体中的每个个体的平均转座子条带数(MTB)显著的高于野蚕群体;(3)有23个在家蚕群体中固定的位点数(Sf)显著的高于野蚕群体。这就说明转座子在家蚕群体内发生了扩张和广泛的固定。5.驱动转座子在家蚕群体和野桑蚕群体中多态性分布的因素为了探究转座子在家蚕群体中扩增和固定的原因,我们分别进行了极大似然估计和应用考虑了瓶颈效应的溯祖模拟方法对这些转座子在家蚕群体和野桑蚕群体中受到的选择压情况进行了估计。极大似然法估计的结果显示:(1)有5个转座子家族(Bm1, Jockey, CR1, Bmmarl, BmMITE-2)在各群体中都受到了正选择的作用;(2)几乎所有的Nes值在家蚕群体中要显著的高于野桑蚕群体。这些结果表明大多数转座子在家蚕群体中受到了较强的正选择压力,而在野桑蚕群体中受到了相对较弱的正选择压力。但是需要注意的是上述方法并没有将瓶颈效应考虑进去。为了排除驯化过程瓶颈效应的影响,我们进一步采取了考虑瓶颈效应的溯祖模拟的方法来判断各个转座子家族在不同群体中受到的选择压情况。结果发现:这些家族大多数在家蚕群体中受到了正选择的作用,而在野桑蚕群体中是服从中性进化的。6.BmMITE-2转座子对邻近基因的调控BmMITE-2插入缺失品系中其邻近基因表达的差异调查,转基因、细胞转染和一些分子生物学手段均证实了BmMITE-2对邻近基因表达有调控作用:BmMITE-2插入到基因的5’端时会显著的增加下游基因的表达;当BmMITE-2插入到基因的3’端时会显著的降低上游基因的表达。综上所述,我们可以得出如下结论:家蚕基因组中含有丰富的MITE转座子家族(17个家族),并且大多数在最近发生了爆发式扩增;大多数转座子在家蚕群体中受到了强的正选择的压力;BmMITE-2插入到基因的5’端会显著的增强下游基因的表达,BmMITE-2插入到基因的3’端会显著的降低上游基因的表达。我们的结果揭示了转座子的功能性并强调有必要重新评价转座子对动植物驯化的贡献和意义。