论文部分内容阅读
随着分子生物学与基因工程的快速发展,植物油体在生物工程上的应用越来越广泛。由于种子油体在基因工程上的应用是通过油体结合蛋白来实现的,所以对植物油体结合蛋白的研究日益受到人们的重视。芝麻、油菜、水稻和拟南芥等物种的油体蛋白序列已经获得,但药用植物红花油体蛋白的基因序列,蛋白序列及调控因子尚属未知。不利于以红花油体作为生物反应器的进一步深入研究及红花油体蛋白作为食品、医药方面表面活性剂等红花油体蛋白功能的开发。Solexa测序技术是近两年迅速发展的一种高通量的测序技术,相对于传统Sanger测序技术,高通量合成测序具有信息覆盖度广,测序程度深的显著特点。Solexa测序技术进行的转录组分析是近年来建立的对基因表达宏观分析方法,具有信息涵盖量大,数据冗余性低,分析准确,可检测到低表达的基因存在,以及不需要具有基因组学背景就可以分析新物种的转录表达概况等多方面优点。cDNA文库是目前获得目的基因全长cDNA最为有效的方法之一。通过各种方法(如差异显示、抑制差减杂交等)所获得的EST片段可以直接作为筛选cDNA文库的探针,利用菌落SOUTHERN杂交,从相应cDNA文库中筛出完整的cDNA克隆。通过生物信息学分析获得目的基因的全长cDNA和蛋白序列。本文用Solexa测序技术对红花种子、叶片和花进行转录组测序及生物信息学分析,得到如下结果:1、获得红花总Unigenes为153769条,其中种子为69121条;叶为51814条;花为100739条。2、进行Unigenes功能注释:包括Unigene的Gene Ontology (GO)功能注释;COG功能注释、pathway注释和蛋白功能注释。注释后结果为:match到nr库的Unigenes为65536条;match到Swiss-Prot库的Unigenes为56843条;match到KEGG库的Unigenes为35056条;match到COG库的Unigenes为11010条。3、构建cDNA文库,我们共获得了7.5×106个克隆,并成功应用生物信息学方法从cDNA文库中挑选出了红花油体蛋白基因的全长序列。