论文部分内容阅读
转座子(Transposon element,TE)是生物基因组的重要组成部分,目前已经在细菌、植物、昆虫、哺乳动物等基因组中发现了大量转座子序列。TE根据是否有RNA介导转座可分为逆转录转座子(ClassⅠ)和DNA转座子(ClassⅡ),而根据转座的自主性又可分为自主性转座子和非自主性转座子。水平转移(Horizontaltransfer,HT)是指遗传物质在生殖隔离物种间的传递。依赖于转座子的寄生特性、移动性和能够重新整合到染色体的能力,转座子水平转移(HTT)在真核生物进化过程中普遍发生,是基因组进化的重要动力。随着基因组测序技术的飞速发展及大量基因组的测序完成,极大地提高了对TE的认识,但与哺乳动物和植物相比,目前关于昆虫TE的研究仍然相对滞后。二化螟具有丰富的遗传多样性,也是威胁水稻的重要钻蛀性害虫。本文在通过同源检索鉴定了小菜蛾Plutella xylostella基因组中5种短散在核元件(short interspersed nuclear elements,SINEs)以及在二化螟 Chilo suppressalis 基因组中一种新型 Helitron 转座子Hel1的基础上,分析了 SINEs和Hel1在昆虫基因组中的分布、对代表性昆虫基因组进化的影响及潜在的水平转移机制,并探讨了二化螟SINEs及Hel1的转录活性及其对生物和非生物胁迫的响应模式。主要研究结果如下:1、鳞翅目昆虫SINE转座子的特征和水平转移通过同源检索,在小菜蛾基因组中鉴定了 5种SINE转座子,其中PxSE1、PxSE2和 PxSE3 是 tRNA 衍生 SINEs、PxSE4 和 PxSE5 是 5S RNA 衍生 SINEs。在 13 个鳞翅目昆虫和1个杆状病毒基因组中共鉴定了 18个相关的SINEs。其中,分别在5种、2种和7种鳞翅目昆虫中鉴定出PxSE1、PxSE2和PxSE3的同源序列,这些元件的共有序列大小在252 bp至333 bp之间,并具有不同的3’尾部。在斜纹夜蛾核多角体病毒Ⅱ(Spodoptera litura nucleopolyhedrovirus Ⅱ,SpltNPⅦ)中发现了 PxSE1 类元件SlNPVSE1,该元件位于编码一个未知蛋白的ORF27内。与PxSE4具有高度一致性的三个元件LaSE2、CsSE2和ObSE2分别在影弄蝶(Leremaaccius)、二化螟和冬尺蠖蛾(Operophtera brumata)的基因组中被发现,而在其它昆虫中未发现类似PxSE5的元件。但 PxSE5 的3,端序列与一个 LINE(long interspersed nuclear element)反转录转座子PxLINE1.1高度同源。PxLINE1.1全长3228 bp,含13 bp的靶位点重复(TSD)和核酸内切酶、反转录酶结构域,并且在末端有一个短的ATGT串联重复序列。所有SINEs的拷贝介于SpltNPⅦ的1个拷贝与烟草天蛾(Manduca sexta)的16157个拷贝间。分歧度最高的是小菜蛾PxSE5为0.132,而最低的来自于冬尺蠖蛾ObSE2为0.012。通过转座子爆发时间预估,发现PxSE1的6208个拷贝中有4796个与共有序列具有95%以上的一致性,其中223个拷贝与PxSE1共有序列具有100%的一致性。在小菜蛾PxSE2、PxSE3和PxSE4、二化螟CsSE1和CsSE2以及冬尺蠖蛾ObSE2中也观察到与共有序列高度一致的大量拷贝。但是,PxSE5各拷贝的一致性值与其它转座子不同,只有49个拷贝(2.5%)与其共有序列一致性超过95%。其它鳞翅目物种的SINEs,如影弄蝶LaSE1和LaSE2、草地贪夜蛾(Spodoptera frugiperda)SfSE1、烟草天蛾MsSE1和 MsSE2、虎凤蝶(Papilioglaucus)PgSE1、金凤蝶(Papilio machaon)PmSE1,它们各拷贝与共有序列的一致性值也较低。PxSE1各拷贝与共有序列的高度一致性表明它很可能是小菜蛾基因组中相对年轻的逆转录转座子,并且在近期发生大量扩增。对小菜蛾基因组中SINE转座子的整合模式分析表明,五种SINE转座子有44%~51%的拷贝插入在基因的内含子中,相似比例的拷贝也被发现分布在距离基因5 kb及以外的区域。仅11个拷贝插入编码区域(coding domains,CDS),1个拷贝插入到5,UTR,13个拷贝插入到3’ UTR。进一步分析SINE插入特征发现,多达60个拷贝插入LOC105382892基因的内含子中,共有95个基因被发现至少插入了 10个SINE元件。这些拷贝的插入相对比较随机,因此,小菜蛾SINE家族可能主要通过促进内含子的结构变异来影响基因的表达调控。23个SINEs共有序列的系统进化树显示,除了 ObSE2,序列内部具有相同启动子的SINEs聚在一起。MsSE2、PgSE1等PxSE3家族转座子的系统树和对应物种的分类树具有相似的结构,表明PxSE3家族在鳞翅目昆虫中可能垂直传播。但SlNPVSE1、SfSE1、海灰翅夜蛾(Spodoptera littoralis)SlittSE1和斜纹夜蛾(Spodoptera litura)SlituSE1聚在一起,且在南方粘虫(Spodoptera eridania)核多角体病毒分离株251和黑色粘虫(Spodoptera cosmioides)核多角体病毒分离株VPN72中均鉴定到了 SlNPVSE1外部侧翼序列的直系同源序列,推测SlNPVSE1是从鳞翅目昆虫通过水平转移插入到核多角体病毒基因组中。研究表明寄主-寄生生物的相互作用促进了 SINE在杆状病毒和鳞翅目宿主间的水平转移。2、二化螟SINE转座子的分布多样性和胁迫响应分析CsSE1和CsSE2在二化螟基因组中的整合模式发现,两个转座子在基因组中的整合模式基本一致,超92%的拷贝插入到基因间区,6.5%的拷贝插入在内含子区,而仅有6~7个拷贝插入潜在的启动子区。不一样的是,CsSE1各拷贝在二化螟基因组基因外显子的插入比例为0.07%,小于CsSE2的1.0%,显示CsSE2对二化螟基因组的影响可能大于CsSE1。通过二化螟转录组分析,分别在418个和504个转录本中发现CsSE1和CsSE2序列,其中26%及36%的拷贝插入CDS区域,其余的拷贝分布于非编码区域。在含有CsSE1的转录本中分别有7个和3个拷贝被注释为编码二化螟气味结合蛋白(odorant-binding protein)和转座酶(transposase)基因,而多个含有CsSE2的转录本都被注释为未知基因。分别以二化螟闽侯种群(MH)、瑞昌种群(RC)、和县种群(HX)、扬州种群(YZ)、江津种群(JJ)和辽阳种群(LY)基因组DNA为模板,对65个插入CsSE2的区域进行了 PCR扩增,获得了 38个具有插入多态性的分子标记,共扩增条带102个其中多态性条带72个,多态性比率(PPB)为70.6%,表明二化螟种群间CsSE2插入位点变异大,存在丰富的遗传多样性。建立了 CsSE1转座子定量检测体系,发现随着二化螟的发育,CsSE1相对表达水平不断升高,表明该转座子和二化螟的发育密切相关。以非生物胁迫(高温40℃和低温5℃)和生物胁迫(苏云金杆菌Bacillus thuringiensis和斯氏线虫Steinernema carpocapsae)处理二化螟3龄幼虫发现,CsSE1转座子相对表达量下降1.3~3.2倍,其中40℃处理和线虫处理分别下降2.1和3.2倍,差异显著。在二化螟转录组中发现三个包含CsSE1的编码转座酶的转录本。结合基因组分析,鉴定出一个转座酶基因 gene-evm013480(RSAL01000408.1:136791-140483),其全长3713 bp,内含子1323 bp,编码789个氨基酸,包含两个重要的结构域,分别为反转录酶和核糖核酸酶H,插入的CsSE1序列形成完整的CDS3区。编码的蛋白包含两个重要的结构域,分别为反转录酶和核糖核酸酶H。该基因在二化螟的卵至成虫四个发育时期的表达水平也不断升高。在非生物胁迫和生物胁迫中,其相对表达量均显著下降,表明该基因可能是二化螟胁迫响应的负调控因子。3、昆虫新型Helitron转座子的分类和进化在分析二化螟CsSE2的侧翼序列时,发现了一个新的Helitron元件。随后在256种昆虫中的27种昆虫基因组中发现了同源Helitrons,并首次在棒络新妇蛛Nephila clavipes和温室希蛛Parasteatodatepidariorum两种蜘蛛基因组中也发现了相关的Helitron元件。通过序列分析,结合Helitron的转座机制,重新修订了 Helitron的分类标准:5’末端相似性最高(30 bp序列一致性至少为80%)的序列属于同一家族,3’末端相似性最高(30bp序列一致性至少为80%)的序列属于同一亚家族,内部序列具有80%以上的一致性被归类为同一种(exemplars)。根据新分类标准,新发现的Helitron被分为2个家族、9个亚家族和35个种。Helitron的拷贝数在不同物种存在差异,从芜菁叶蜂(Athalia rosae)ArosHel1Aa 的 4 个拷贝至细纹蚬蝶(Calephelis virginiensis)CvirHel1Ea的5578个拷贝不等。序列分歧度最高的是家蚕(Bombyx mori)BmorHel1Aa 为 15.672,而最低的来自于二化螟 CsupHel1Aa 为 0.01。在棒络新妇蛛、温室希蛛、茴香凤蝶P.machaon、菜蛾盘绒茧蜂Cotesia vestalis、草翅叶蝉Homalodisca vitripennis、芜菁叶蜂、矮竹节虫Timema cristinae中发现了7个具有不完整转座酶编码序列的Helitron转座子。其中,最长的Helitron在芜菁叶蜂中被发现,长度为8065 bp。通过blast分析,在菜蛾盘绒茧蜂、温室希蛛、茴香凤蝶和芜菁叶蜂中重建了 4个具有完整ORF并编码1495、1467、1495和1496个氨基酸的潜在自主性Helitron。多重比对表明,预测的Rep/螺旋酶由一个包含“两个His”复制起始基序和两个保守酪氨酸残基的Rep基序和一个包含DNA螺旋酶SF1超家族八个保守基序的螺旋酶结构域组成。这4种Rep/螺旋酶的氨基酸同源性超过86%。进一步分析了两个具有代表性的柑橘凤蝶Papilio xuthus和菜粉蝶Pieris rapae基因组中PxutHel1Aa、PxutHel1Ab和PrapHel1Aa转座子的整合模式。有52%~58%的转座子拷贝插入到内含子区域,只有3~7个拷贝插入到外显子中。多达4个PrapHel1Aa拷贝插入到LOC110995424基因的内含子中。然而,在大多数情况下,一个特定基因的内含子区域只检测到一个拷贝。因此,柑橘凤蝶和菜粉蝶Hel1 Helitrons主要参与内含子的结构变异,从而影响基因表达的调控。在草地贪夜蛾基因组中发现了 SfruHel1Aa、SfruHel1Ab和SfruHel1Ac的核心序列Sfcore。进一步分析表明,与Sfcore相比,SfruHel1Aa的5’端下游130 bp处插入了一个35 bp的“A”区片段,SfruHel1Ab中“A”区插入了一个66 bp的“B”区片段,而一个108 bp的“C”区片段插入到SfruHel1Ac的“B”区。一致序列的比对显示插入位点与重叠区域一致。在基因组中,均发现了 A区和B区序列的潜在源位点,且在每个源位点中鉴定出2-13bp的末端连接。结合三个转座子分歧度的显著差异推测SfruHel1Aa、SfruHel1Ab 和 SfruHel1Ac 通过填充 DNA 机制而形成。利用35个Helitrons共有序列构建的系统发育树表明,温室希蛛PtepHel2Ca在进化上与其它Hel1不同,且同一目昆虫没有聚集在一起。Hel1与宿主系统发育的不一致性,以及Hel1在远缘物种中的不连续分布和高度序列相似性,揭示Hel1水平转移的发生可能包含多种机制。菜粉蝶基因组中有多达11个元件被发现与PrapHel1Aa的一致序列完全相同,表明PrapHel1Aa元件最近入侵了菜粉蝶基因组。重建的系统发育树显示CvesHel1Aa的拷贝嵌套在由PrapHel1Aa拷贝构成的分支中。此外,PrapHel1Aa和CvesHel1Aa的共有序列除PrapHel1Aa有个169bp插入外,其它序列具有98%以上的同源性,169bp的插入片段在PrapHel1Aa的短拷贝Prap0202中几乎完全缺失,Prap0202与八个菜蛾盘绒茧蜂CvesHel1Aa拷贝的同源性超过94%。因此,推测PrapHel1Aa通过HTT从菜蛾盘绒茧蜂中获得,随后捕获169bp的片段并在转座中快速爆发。研究结果表明非规则的寄主-寄生生物相互作用可能更有利于HTT。4、二化螟Helitron转座子的多样性和胁迫响应在二化螟基因组中总共鉴定了 CsupHel1Aa、CsupHel1Ab和CsupHel1Ea的10717个拷贝,占基因组0.31%。对三个转座子在基因组中的整合模式研究发现,CsupHel1Aa和CsupHel1Ab插入模式相同,均分别有21%和78%的拷贝插入到内含子和基因间区,外显子和基因上下游2 kb区域无插入。CsupHel1Ea分别有12.8%和87%的拷贝插入到内含子和基因间区,分别有6个和3个拷贝插入到外显子和基因上下游2 kb区域。CsupHel1Aa和CsupHel1Ab分别有95.8%和92.7%的拷贝与各自共有序列具有95%以上的一致性,其中有209个和154个拷贝与它们的共有序列具有100%的一致性,表明这两类转座子最近可能发生了转座。但CsupHel1Ea各拷贝的一致性值与其它转座子不同,只有839个拷贝(20.3%)与它的共有序列一致性超过95%。在二化螟转录组的非编码序列库中,有99个转录本与三个Helitrons高度一致,其中33个转录本与CsupHel1Aa转座子同源,27个转录本与CsupHel1Ea转座子同源,3个转录本与CsupHel1Ab转座子同源。在转录组的编码序列库中,5个转录本与CsupHel1同源,1个转录本与CsupHel1Aa转座子同源。比较这些转录本的特征发现,该5个转录本序列长度较短(<200bp),且差异均在5’端。Helitron转座子CsupHel1随着二化螟的生长发育,相对表达量逐渐升高,表明该转座子也和二化螟的发育相关。以非生物胁迫和生物胁迫处理二化螟三龄幼虫发现,CsupHel1转座子相对表达量下降2.0~2.7倍,差异显著,其中斯氏线虫的处理下降最多为2.7倍,表明Helitron可能是二化螟应对胁迫反应的一种潜在的负调控因子。本文利用生物信息学方法系统研究了新型SINE和Helitron转座子在昆虫基因组中的分布、在宿主昆虫基因组中的插入特性及其潜在的水平转移机制,并利用RT-qPCR分析了二化螟SINE和Helitron转座子对逆境胁迫的响应,研究结果对于揭示昆虫SINE和Helitron转座子的分子进化机制及其在宿主昆虫适应逆境胁迫过程中的作用具有重要的科学意义。