论文部分内容阅读
短丝木犀(Osmanthus serrulatus)为木犀属少数4月份开花的香花树种之一,分布范围狭小,具有极大的开发前景和保护价值。本研究以短丝木犀为研究对象,利用基于Illumina平台的RNA-seq技术得到丰富的转录组数据,并进行了相关生物信息学分析,挖掘了大量SSR位点,并开展了SSR特征分析和多态性引物开发工作。主要结论如下:(1)基于Illumina HISeq 2000测序平台对短丝木犀花和叶芽两个组织器官进行转录组双端测序(paired-end sequencing),经测序数据过滤和Trinity拼接组装后,得到189,993条转录本(transcripts),平均长度为1,169 bp,N50为2,017 bp;得到92,798个unigenes,平均长度为697 bp,N50为1,200 bp。测序和组装结果良好。(2)将92,798个unigenes与Nr、Nt、Swiss-Prot、Pfam、GO、KOG、KO 7个数据库比对后,有3,783(4.07%)个在七个数据库都得到注释。GO注释分为3个大类,46种生物功能;KOG分为26个类群(group),只有一般功能预测(General funetion predietion only)构成最大类群;KEGG分析共涉及5个分支,262个代谢通路,参与色素合成和芳香物质等次生代谢物合成的unigenes共337个。(3)共获得64,576个CDS,其中通过BLAST比对蛋白数据库共获得31,925个CDS,运用Estscan得到32,651个CDS。(4)利用MISA软件对短丝木犀转录组数据进行大通量的SSR位点挖掘,发现4,189条含不同重复基元的SSR序列,共搜索出4,306个SSR,包含SSR的一致序列出现频率为4.64%,平均跨度为15.02 kb;共出现61种重复基元,AG/CT(41.94%)、AC/GT(14.40%)、AT/TA(9.71%)、AAG/CTT(9.24%)、AAT/ATT(5.99%)。AG/CT、AAG/CTT分别构成二、三核苷酸重复类型中的最多重复基元;除六核苷酸重复,微卫星丰度和重复基元长度呈负相关;微卫星的长度范围12~120 bp,均长16 bp,主要集中在较短序列范围内,微卫星的出现频率与微卫星的序列长度呈负相关;预测多态性较高的SSR分布长度较长的较短重复基元类型里。(5)利用Primer 3针对4,189个含有SSR序列的unigenes进行引物批量设计,成功设计2,366对引物,引物设计成功率56.48%。(6)随机挑选的50对引物中,28对扩增出条带,有效扩增率56%。其中19对引物扩增产物在预期大小,7对引物PCR扩增产物大于预期大小,2对PCR扩增产物小于预期大小。10对引物显示多态性,占随机抽取引物总数的20%。