论文部分内容阅读
玉米是世界上重要的粮食、饲料及能源作物,其总产量已跃居所有作物之首。然而,随着世界人口的急剧增长,可耕种土地面积的大幅度缩减以及全球气候变化的加剧,使得玉米的安全生产面临着巨大的压力。因此,合理利用野生资源,挖掘有利等位基因,不断提高玉米的生物、非生物抗性以及单位面积产量就显得尤为重要。本研究利用转录组测序的方法对6份大刍草品系以及10份玉米自交系进行了苗期转录组测序,通过大刍草转录组的de novo拼接及功能注释,为大刍草的遗传研究提供了一套较为完整的转录组序列信息;同时,基于大刍草与玉米转录组之间的序列比对,本研究剖析了大刍草与玉米之间转录本序列的多样性,对大刍草苗期特异转录本的来源进行了追溯;最后,本研究比较了玉米与大刍草之间直系同源基因可变剪切水平的差异,结果显示玉米的驯化过程倾向于增加基因的可变剪切水平,以增加玉米基因转录本的多样性,从而提高玉米的生态适应性。本研究主要结果如下:1.通过大刍草苗期转录组测序,本研究de novo拼接得到了一套高质量的大刍草苗期转录组数据,总共拼接了98,431个unigenes,其中N50及N90长度分别为1,170 bp与322 bp,平均长度为770 bp。通过与KEGG、COG以及Pfam等数据库进行序列相似性比对,获得了62,989个大刍草unigenes(63.99%)的注释信息。2.玉米与大刍草之间的转录本序列比对结果显示:75%的大刍草unigenes在二者间高度保守;同时,本研究也发现有~10%的unigenes特异性地在大刍草中表达,其中有721个unigenes能够很好地与拟南芥、水稻、高粱以及短柄草的基因序列进行匹配;另外,有571个unigenes能够很好地匹配到玉米参考基因组的基因间区域,为表达的存在/缺失变异(expressed presence/absence variations,e PAVs)。3.基于高通量测序得到的不同样本的测序数据,本研究一方面将所有样本的reads比对到B73参考基因组,共检测到588,971个SNPs及270,024个Indels,系统进化树分析结果显示温带玉米自交系、热带玉米自交系以及不同亚种的大刍草样本能够很好地进行区分;另一方面,针对de novo拼接所得到的98,431个unigenes,总共鉴定到14,659个简单重复序列(Single Sequence Repeat,SSR)位点,并设计了11,286对基于大刍草基因组信息的SSR标记,为今后大刍草的遗传分析及群体遗传学研究提供分子标记。4.本研究同时也鉴定了13,593个玉米与大刍草间直系同源的基因,并对同源基因间的可变剪切事件进行了鉴定。研究结果显示二者间可变剪切的类型与比例并无显著差异,内含子保留及可变受体位点两种可变剪切类型占所有可变剪切事件的60%以上。在玉米中,每个发生可变剪切的基因能够检测到4.12种不同的可变剪切转录本,而大刍草只有2.26种。同时,对于内含子保留这种可变剪切类型,共检测到98个转座子插入到94个玉米基因的内含子中,而只有9个转座子插入在大刍草所保留的内含子中,以上结果显示转座子插入在玉米可变剪切形成过程中可能发挥了重要的作用。另外,比较玉米与大刍草的可变剪切水平发现:有3,864个基因的可变剪切水平在不同物种间存在显著差异,多数基因(2,766,71.58%)在玉米的驯化改良过程中倾向于增加基因的可变剪切水平,其中有151个可变剪切水平改变的基因与转录调节与胁迫响应相关,并位于玉米改良过程中受到强烈选择的区段内,证明基因可变剪切水平的增加很可能发生在玉米的改良阶段。本研究所得到的一整套转录组数据能够为今后大刍草的遗传学研究提供序列支持,同时也能够为玉米野生资源中有利基因的挖掘提供参考。另外,通过比较可变剪切水平的差异,可以更加全面地了解玉米的驯化和改良。