论文部分内容阅读
二化螟Chilosuppressalis属鳞翅目(Lepidoptera),草螟亚科(Crambidae),在中国的分布广泛(北达黑龙江克山县,南至海南岛)。幼虫蛀食水稻茎秆,造成枯心,且具有越冬场所多(寄主有水稻、玉米、甘蔗、粟、蚕豆、茭白、高粱、油菜、小麦、紫云英等)、转株钻蛀为害等特点。上世纪90年代以来,水稻二化螟对水稻的为害一直较重。长期的化学防治使二化螟抗药性不断增强,不少常规防治药剂相继被淘汰。由于化学防治的局限性,生产上迫切需要开发新的手段用于害虫防治。中肠是昆虫与植物互作的主要场所,其消化酶是新农药开发和培育转基因抗性水稻品种的潜在靶标。胰蛋白酶(trypsin)、组织蛋白酶(cathepsin)及丝氨酸蛋白酶抑制剂(serpin)是与中肠消化有关的主要酶类。尽管这些蛋白酶及抑制剂一直是国内外学者研究的热点,二化螟的蛋白酶及抑制剂基因家族的研究尚未引起足够重视。另外,随着基因组测序、转录组测序和蛋白组测序等组学技术的发展,相关研究手段已广泛用于基因的高通量鉴定。本研究作为973预研项目的一部分,将水稻螟虫作为主要的研究对象,系统分析了二化螟的转录组数据,对其消化相关的蛋白酶及其抑制剂基因进行了克隆、功能分析和启动子调控机制的研究,主要结果如下: 1.二化螟转录组分析及候选序列的验证 用二化螟各龄期试虫混合样品提取的总RNA构建转录组文库,运用二代测序技术(Illumina)获得25,783,374条二化螟短读序列(shortreads)(由华大完成)。通过生物信息软件进行序列组装和聚类后得到116,262条unigenes,同源搜索NCBInr数据库发现其中27,181条序列与已报道基因同源。对这27181条序列进行nr、GO、COG和KEGG注释后,初步揭示了这些基因的功能、所属的24个COG分类和参与KEGG的过程。基于生物信息注释和手动注释,验证了其中72条胰蛋白酶、11条组织蛋白酶和12条丝氨酸蛋白酶抑制剂的基因序列。 2.胰蛋白酶、组织蛋白酶及丝氨酸蛋白酶抑制剂基因的全长克隆 利用RACE技术对上述基因进行全长序列克隆后,得到28条(10条全长序列、18条为5或3端截短)胰蛋白酶cDNA序列、8条(5条全长序列、3条为5或3端截短)组织蛋白酶cDNA序列和11条(10条全长,1条为5端截短)丝氨酸蛋白酶抑制剂cDNA序列。它们推导的氨基酸序列与鳞翅目对应基因的氨基酸序列具有较高相似性。序列结构和特征位点分析表明:克隆的胰蛋白酶全长cDNA序列中CT004、CT005、CT007、CT008、CT009和CT010编码胰蛋白酶基因,CT001、CT002、CT011和CT012编码胰凝乳蛋白酶基因,CT006编码丝氨酸蛋白酶同系物。克隆的组织蛋白酶全长cDNA序列中CCL1~CCL5编码组织蛋白酶L型,CCO1和CCO2编码O型,CCB1编码B型,CCF1编码F型。丝氨酸蛋白酶抑制剂cDNA序列中CS001、CS003、CS005、CS007和CS010编码胰蛋白酶抑制剂基因,CS002、CS006、CS008和CS013编码胰凝乳蛋白酶抑制剂基因,CS011编码未知抑制特性的抑制剂基因,CS004和CS012编码混合型蛋白酶抑制剂,CS004可能同时抑制胰蛋白酶和弹性蛋白酶,CS0012可能同时抑制胰凝乳蛋白酶和凝血酶。 3.三类基因的组织表达及功能分析 组织表达分析结果表明:绝大部分trypsin基因都在二化螟中肠高表达,且同时分布于二化螟绝大部分的组织中;绝大部分serpin基因都在中肠中表达,均匀分布于二化螟大部分组织;大部分cathepsin基因集中分布于血淋巴,其次是中肠,其他组织也有分布。没有发现组织特异性trypsin、cathepsin或者serpin基因。 寄主转换实验结果表明:1)取食小麦后,胰蛋白酶基因CT002、CT007、CT008、CT010和CT012,组织蛋白酶基因CCL4和丝氨酸蛋白酶抑制剂基因CS007和CS008在幼虫体内表达量显著上调,其中CT008、CT010和CS007极显著上调;CS001和CCL3显著下调。2)取食茭白后,胰蛋白酶基因CT002、CT005、CT007和CT008,组织蛋白酶基因CCO1和CCL4和丝氨酸蛋白酶抑制剂基因CS002和CS007在幼虫体内表达量显著上调,其中CT007、CT008、CT005、CCL4、CS002和CS007极显著上调;CT012、CS001和CCL3的表达量显著下调,其中CT012极显著下调。3)CT002、CT007、CT008、CS007和CCL4的表达量在幼虫取食茭白和小麦后均显著上调,CS001和CCL3的表达量在幼虫取食茭白和小麦后均显著下调。 饥饿实验表明:1)二化螟幼虫饥饿24h后,胰蛋白酶基因CT002、CT005、CT006、CT007、CT008、CT009和CT0011,组织蛋白酶基因CCL1、CCL4和CCB1和丝氨酸蛋白酶抑制剂基因CS001、CS002、CS007、CS008和CS013的表达量显著下调,其中CT002、CCL4、CCB1、CS007和CS013极显著下调;胰蛋白酶基因CT004和组织蛋白酶基因CCO1和CCL5显著上调。2)饥饿48h后,胰蛋白酶基因CT001、CT002、CT005、CT006、CT007、CT008、CT009、CT011和CT0012的表达量显著下调,其中CT006、CT007、CT008、CT011和CT0012极显著下调。3)然而,与饥饿48h的幼虫的表达量相比,饥饿24h再取食24h后的幼虫的胰蛋白酶基因CT001、CT002、CT005、CT006、CT007、CT008、CT009、CT011、CT0012,组织蛋白酶基因CCB1、CCL1和丝氨酸蛋白酶抑制剂基因S001、CS002、CS006、CS007的表达量显著上调,其中CT012和CS006的表达量极显著上调;组织蛋白酶基因CCO1和CCO2,以及丝氨酸蛋白酶抑制剂基因CS010、CS004和CS005的表达量显著下调,其中CS010、CS004和CS005极显著下调。表明大部分二化螟胰蛋白酶、组织蛋白酶和丝氨酸蛋白酶抑制剂参与了食物消化过程。 干扰实验中,注射不同dsRNA(dsCCL2、dsCC01和dsCCB1)72h后,与阴性对照注射dseGFP实验组相比,CCL2、CC01和CCB1基因的mRNA水平在12h后显著下降,24h降至最低(分别下调了83.3%,67.9%和81.9%)后开始回升。同时,幼虫存活率在12h显著下降,直至60h达到最低(分别下降了58.9%、63.3%和60%)。敲低CCL2、CC01和CCB1基因的表达量后,二化螟幼虫的死亡率明显增高,表明dsCCL2、dsCC01和dsCCB1具有杀虫活性。 4.CT008基因启动子区活性分析及几个基因原核表达载体的构建 本文克隆了CT008基因5非翻译区(unstranslatedregion,UTR)的调控区序列(7,676bp),其中包括长度为1,822bp的邻近启动子调控序列。通过生物信息软件,在邻近启动子序列中发现了36类共142个可能的转录因子调控位点。构建了6个以二化螟CT008基因5端侧翼启动子区缺失片段为启动子的表达报告基因萤火虫荧光素酶(Lue)的重组质粒,并将重组质粒转染Sf9细胞后检测Lue活性。研究结果表明CT008基因5非翻译区-482~-197bp处含抑制启动子活性的转录因子结合位点,-739~-482bp处含增强启动子活性的位点,-1137~-920bp区域存在下调转录因子结合位点。此外,本文成功构建了6个消化相关基因(pET30a-CS007、pET30a-CS003、pET30a-CT008、pET30a-CT004、pET30a-CT005、pET30a-CCO2)的原核表达载体,且通过实验证实都能在IPTG的诱导下表达。 本论文结合二化螟转录组数据和分子克隆,成功克隆了与二化螟消化和免疫相关的基因序列,分析其蛋白结构及催化特征位点并对其表达谱进行了比较。在此基础上,通过寄主转换、饥饿再取食和RNAi分析了这些酶的潜在功能。此外还克隆了蛋白酶基因CT008的5侧翼区启动子序列,分析了其序列结构和调控功能。研究结果为深入研究二化螟的消化机制打下了基础,并为开发针对二化螟消化系统的酶抑制剂和毒性蛋白酶提供了基因信息。