论文部分内容阅读
黄瓜是全球十大蔬菜栽培作物之一,我国的黄瓜总种植面积及总产量目前已跃居世界首位,而黄瓜霜霉病作为全球范围内黄瓜产区主要叶部病害之一,严重威胁着黄瓜的正常生产。鉴于目前黄瓜霜霉病的分子生物学研究较少和ESTs分析功能基因组具有的明显优越性,构建受霜霉菌侵染的黄瓜叶片cDNA文库并进行ESTs分析,对于研究黄瓜与霜霉菌互作过程中的基因表达,克隆黄瓜抗霜霉病基因,明了黄瓜的抗病机理具有重要指导意义。试验比较了目前常用的十种RNA提取方法对黄瓜不同组织(根、茎、叶和幼果)总RNA的提取效果,进而采用改良SDS法提取接种霜霉病菌后第4h、8h、16h、24h、48h和72h的抗霜霉病黄瓜品种‘649’的叶片总RNA,等量混合作为反转录模板,使用CreatorTM SMARTTM cDNA Library Construction Kit构建霜霉菌接种初期黄瓜叶片的全长cDNA文库,从中随机大规模挑取阳性克隆进行序列测定并进行全面的生物信息学分析。主要研究结果如下:1.黄瓜属于RNA易提取植物,十种方法基本上都可以从黄瓜四种组织中提取到RNA,但提取效果间存在一定的差异。十种方法对黄瓜叶和幼果中RNA的提取效果普遍优于对黄瓜根和茎中RNA的提取;对黄瓜叶片RNA提取效果较好的方法有RNAPlant试剂法和改良SDS法;对黄瓜幼果RNA提取效果较好的方法有Trizol法、SDS法和改良SDS法;十种方法提取黄瓜根和茎中的RNA,在纯度方面均不高,但基本上都可保证所提RNA的完整性。2. cDNA文库构建过程中:确定LD-PCR的循环数为21个循环,发现cDNA与pDNR-LIB载体以1.5:1比例连接时效果较好。经质量检测,获得的原始文库滴度为5.5×106pfu·mL-1,重组率约为99%。而扩增后的文库滴度达6.5×109pfu·mL-1。文库中包含的插入片段大小在0.5-2.0kb之间,并多在1.0kb左右,最大片段约为2.0kb。3.从黄瓜cDNA原始质粒文库中随机挑取3360条阳性克隆进行测序,成功得到3091条ESTs序列,使用SeqClean软件去除载体序列、重复序列和长度少于100bp的序列后,最终得到的2903条高质量的ESTs序列,所得ESTs序列长度范围为101-604bp,平均长度414.6bp,GC含量平均为42.44%。4.使用CAP3软件对2903条ESTs序列进行聚类拼接,得到2507条非重复序列(Unigenes),其中包括211个Contigs和2296个Singlets,非冗余序列占全部序列的86.36%,得到的unigenes序列长度范围为101-1426bp,平均为422.73bp,GC含量平均为38.21%,长度在600bp以上的有53条。5.基因表达丰度分析表明:在2507条unigenes中,共有高丰度表达基因(表达频率≥5)18个,约占总数的0.72%;中丰度表达基因(5>表达频率≥2)139个,约占总数的7.69%;其余低丰度表达基因约占91.60%,说明黄瓜叶片中大多数基因呈低丰度表达。6.同源性来源分析表明:在2507条unigenes中,共有1653条(占总数65.94%)在NCBI非冗余核苷酸数据库(nt)中有其匹配序列,序列同源性来源于110多个物种,来源较多的依次是黄瓜(23.29%)、葡萄(13.43%)、杨属(13.19%)、大豆(10.41%)等。7.对组装后的2507条unigenes在NCBI和Swiss-Prot非冗余蛋白数据库中进行blastx比对,共获得超过500种的已知功能蛋白,根据蛋白类别可将其划分为四类,将具有已知功能和推测功能的1547个unigenes在UniProt数据库中确定其蛋白功能,构建基因表达图谱,被赋予功能的基因累计达到2231个(包括一因多效),其中参与抗病/防御的基因有427条占19.16%,参与信号转导的56条占2.51%。8.对组装后的2507条unigenes在COG数据库中比对,结果显示:共有662个unigengs在COG数据库中得到功能注释信息,涉及23项蛋白功能,其中信息储存和加工类有351条占53.01%,细胞加工类有44条占6.65%,代谢类有207条占31.27%,防御类有5条占0.76%,功能不明确有55条占8.31%。9.对组装后的2507条unigenes序列在KEGG数据库中进行比对,结果显示:共有1851个unigengs获得相关的注释信息,涉及44个的非重复代谢途径,Pathway分析表明:对代谢途径的注释主要集中在各类氨基酸的合成与代谢、有机物合成与代谢等方面,还包括3个信号传导途径,3种疾病的发生途径,一个抗原加工途径和一个霍乱弧菌的侵染途径。10.通过在NCBI、Swiss-Prot、KEGG和COG数据库的比对,最终确定有468条unigenes在上述四个数据库中均未找到其匹配项,确定为新基因。