论文部分内容阅读
梅花(Prunus mume)属蔷薇科(Rosaceae)李属(Prunus),早春开花的观赏植物,是我国的传统名花。近来,梅花的全基因组测序已经初步完成,转录组的信息依然相当匮乏,GenBank数据库中关于梅花表达序列标签(ESTs)和mRNA序列的信息只有4666条。为了更加深入的研究梅花的转录组信息,本论文对梅花组织来源的RNA开展了转录组测序及数据分析工作,得到如下主要结果:1.应用Illumina HiSeqTM2000双末端测序技术(Pair-end sequencing, PE),按照有参考基因组的转录组测序流程及数据分析方法,本试验得到了125,865,634条高质量的序列信息,近11.3Gb的数据量。在容许两碱基错配的基础上,每个样本有75%以上的数据可以比对到参照基因组。总数据量汇总,80.43%可以比对到参考基因组,其中76.77%可以唯一比对到参考基因组上,3.66%可以比对到参考基因组的多个位置。其余6.48%的数据是低质量的数据或者与参考基因组有多个匹配位点。2.基于RPKM法,本研究比较分析了组织间差异表达基因,对花器官表达丰度较高的基因进行了聚类分析,得到若干花器官显著差异表达基因。另外,基因表达注释分析中,14243条Unigene注释到Gene Ontology数据库;18916条Unigene注释到SWISS-PROT数据库;14140条Unigene注释到KEGG pathway数据库;24922条Unigene注释到UniProtKB/TrEMBL数据库,极大丰富了梅花的转录组信息。3.现有数据库中对转录本的注释还不全面,通过高通量测序我们能检测到各个组织新的转录本。本研究中分析了四种可变剪接类型,包括A5SS, A3SS, SE, RI。发现可变3’剪接在梅花中最普遍,在所有可变剪接事件中占到55.7%,在所有可变剪接基因中占到54.4%。4.对样品中SNP的检测有助于研究单核苷酸的变异引起的蛋白质功能的变化,从而作为梅花各种基因型与表现型的检测依据。本试验系统检测了各个组织中SNP位点。本研究使用高通量测序技术研究了梅花转录组,并进行了数据分析工作的结果极大丰富了梅花转录组数据资源,为探讨梅花的生物学性状的分子机理打下了坚实的基础。