论文部分内容阅读
玉米是重要的粮食、饲料和燃料作物。完善的参考基因组对玉米基因组学研究和分子育种具有重要的意义。玉米B73基因组自2009年公布以来,其在玉米分子育种和玉米功能基因组研究中起到重要的作用。由于玉米基因组多样性和起源于热带,温带玉米自交系B73缺少热带玉米特异的基因和多样性。另外,虽然有研究发现基因组大小与开花可能存在一定关系,但种植地点单一,不能同时反映温带和热带地区的情况;而且用其它基因组特征作为开花早晚标记的报道也很少。由于温热带玉米种质基因组差别大,在使用现有玉米芯片进行种质资源评价、标记开发和基因初步定位等过程中,基于B73或温带种质的玉米芯片来评价热带玉米种质就会产生偏差。为了解决以上问题,本研究对79份温热带玉米自交系进行重测序,并对其中的31份热带玉米自交系进行三代转录组混池测序。利用流式细胞技术测量温热带玉米基因组大小,利用重测序数据计算180-bp染色体结序列丰度,并结合开花期分析三者之间的关系;基于重测序数据分析得到的热带玉米种质特异的SNP等,开发了一款提高基因组覆盖度的新型55 K SNP芯片。主要结果和结论如下:1.对31份热带玉米自交系两周的幼苗和五周的顶端分生组织进行三代转录组混池测序,构建三个大小分别为1-2 Kb、2-3 Kb和3-6 Kb的文库,分析表明其平均插入序列长度依次为1,511bp、2,246 bp和3,681 bp。对定位到基因组上的测序序列进行染色体密度分布统计,发现测序序列均匀地分布于染色体上。读取经过聚类、校正和去冗余之后,有35.63%的序列能够比对到参考基因组上。2.与参考序列注释比较,得到已知注释基因16,121个、未知功能基因2,991个,并且得到944个融合基因。对基因结构进行了优化,包括对5’和3’端进行延长,得到41,136条序列,有9,932个基因。3.温带玉米自交系与热带玉米自交系之间的基因组大小存在着显著的差异;并且基因组大小与玉米染色体结180-bp序列丰度呈中度正相关。通过对回帖到180-bp染色体结序列上的读取进行拼接发现丰度排名前十条的180-bp染色体结序列高度变异,只有50%的相似性。4.表型调查及分析结果显示,无论在热带地区还是温带地区,无论热带自交系还是温带自交系,无论雌花还是雄花,基因组大小均与开花正相关。通过全基因组关联分析确定了三个与基因组大小相关的位点,其中两个是新发现的,另外一个位点位于已知的染色体结K8L1和K8L2附近。5.基于重测序基因组数据的SNP和已发表的368份玉米转录组数据的SNP,开发了新型玉米55 K芯片。该芯片的特点是:(1)使用了热带玉米自交系特有序列中的SNP,提高了该芯片的基因组覆盖度;(2)使用支持向量机训练已知杂种优势群的SNP,获得能够区分杂种优势群的SNP,为该芯片引入能够更好的区分杂种优势群PA和PB群的SNP标记;(3)包括能够检测转基因事件的SNP标记;(4)引入了经典基因的SNP;(5)从现有芯片引入了一套核心SNP。综上所述,这些结果为热带玉米种质提供了特异的基因组信息,为利用热带种质进行分子育种和种质资源评价提供理论基础和技术支持。