论文部分内容阅读
长链非编码RNA(Longnon-codingRNA,lncRNA)是一类长度大于200nt的不编码蛋白质的RNA。最近几年关于lncRNA的研究和报道如雨后春笋般,不断涌现,成为当前研究的热点。LncRNA参与了基因组印记、X染色体沉默、染色质修饰、转录激活、转录干扰、核内运输以及生长发育等多种重要的调控过程。随着高通量测序数据的不断积累,转录组拼接算法的不断改进,预测流程的不断完善,果蝇(Drosophila melanogaster)、蜜蜂(Apis mellifera)等10多种昆虫的lncRNA被相继预测和发现。本文构建和优化了昆虫lncRNA的预测流程,对褐飞虱(Nilaparvata lugens)和小菜蛾(Plutella xylostella)的lncRNA进行了预测和特征分析。主要结果如下:1.褐飞虱长链非编码RNA的发现及和特征分析在前期已经分析12个褐飞虱转录组的基础上,进一步收集NCBISRA数据库中的4个褐飞虱转录组,包括杭州种群,台湾地区种群,雌性唾液腺,三龄若虫翅芽组织等,利用最新的有参拼接软件HISAT2和StringTie拼接转录组,构建新的生物信息学流程,预测了褐飞虱的lncRNA基因,共发现2,386条lncRNA基因。特征分析发现,褐飞虱lncRNA与先前本实验室预测的褐飞虱lncRNA相同,并与人(Homo sapiens)、线虫(Caenorhabditis elegans)、斑马鱼(Danio rerio)lncRNA 特征相似,含有两个外显子转录本占有较高的百分比;蛋白编码基因的平均长度为1106 bp,而lncRNA的转录本长度明显更短,只有596 bp;另外褐飞虱约12.2%的lncRNA发生了选择性剪切,其中有部分lncRNA基因转录出多条转录本,可能与lncRNA的转录本动态表达有关。2.小菜蛾长链非编码RNA的发现及和特征分析在NCBISRA数据库获得小菜蛾不同发育时期(卵、幼虫、蛹、成虫),寄生种群(被半闭弯尾姬蜂Diadegma semiclausum寄生的小菜蛾和对照组),Bt蛋白抗性组(Cry1Ac敏感和抗性中肠组织)以及不同农药抗性种群(毒死蜱和氟虫腈抗性)等13个不同的转录组样本。构建生物信息学流程预测了小菜蛾lncRNA基因,共发现2,639条lncRNA基因。分析其特征发现,小菜蛾lncRNA与褐飞虱、人、线虫、斑马鱼lncRNA特征相似,含有两个外显子的lncRNA转录本占比最多:与蛋白编码基因相比,转录本长度明显更短;表达分析发现,在Cry1Ac抗性和Cry1Ac敏感中肠组织中发现31个差异表达的lncRNA,被D.semiclausum寄生的小菜蛾与对照组相比出现11个差异表达的lncRNA,在卵、幼虫、蛹、成虫不同的发育时期共有160个lncRNA差异表达;另外,在不同的发育时期样本中TCONS00147638与TCONS00147639两个lncRNA在基因组中呈串联,位于小菜蛾基因Px013127的内含子反向链上,并出现共表达现象。在被D.semiclausum寄生的小菜蛾与对照组中发现两个处于基因间区串联的lncRNA TCONS0013670和TCONS0013672,同样出现共同表达现象。为多个lncRNA共同调控基因表达提供了重要的理论依据。3.小菜蛾lncRNA链特异性序列验证为了确定从小菜蛾13个不同转录组中预测到的2,639条lncRNA的准确性和方向性,随机选择10条lncRNA,对序列进行了 PCR lncRNA链特异性验证。电泳结果表明:10条lncRNA中8条与预测目标条带大小一致,测序结果与预测的lncRNA序列比对结果一致,验证成功。8条lncRNA验证方向均是3’端出带。另外2条未扩增出目的条带。表明预测流程具有较高的预测准确性,为深入研究昆虫lncRNA的功能提供了重要的基础。