论文部分内容阅读
生物信息学是一门生命科学与计算机科学的交叉学科,它通过综合利用生物学、计算机科学及信息技术从海量生物数据中挖掘赋有生物学意义的信息。近几年来,利用生物信息学技术对植物转录组测序数据的挖掘,已成为生命科学领域各学科的研究热点。本研究围绕影响小麦产量的分蘖性状,以多分蘖与寡分蘖近等基因系材料的转录组测序数据作为分析对象,分别从mRNA、lncRNA及miRNA入手,依据材料特性从大量数据中筛选与分蘖相关的数据集合。首先,通过多寡材料间表达差异显著性验证、同源基因注释、功能注释与通路分析,从大量的小麦转录组测序数据中分别鉴定及筛选了分蘖相关的mRNA、ncRNA数据集。依据3种RNA在材料间的表达趋势或互作关系构建了WGCNA与ceRNA网络,筛选目标性状相关的多种RNA互作关系。随后,本研究还基于2对近等基因系材料的转录组,挖掘在多寡分蘖材料间呈现多态性的SSR标记,为后续开发能够区分多寡分蘖基因型的分子标记奠定基础。最后,将多态性SSR标记开发过程中所自行编写的序列比对算法进行优化及汇总,形成高效、准确且易安装使用的多态性SSR标记开发软件。本文鉴定及筛选出的分蘖相关的多种RNA数据集合、RNA间的相互关联性、转录组多态性SSR标记,为后续研究小麦分蘖机制提供了更精准的参考信息。开发的多态性SSR标记挖掘软件,同时可推广应用于其他物种基因组或转录组数据。获得的主要结果如下:1.获得差异表达的分蘖同源基因,精确了分蘖相关基因参考范围。计算得到10102个小麦基因在本研究的比较组中差异表达,通过生物信息学分析手段,最后锚定到15个基因与拟南芥及水稻中的分枝分蘖基因同源,它们的差异表达特性在2对近等基因系的多寡材料间可以重复,且在多寡分蘖材料间的上下调关系与前人所报道的其分枝分蘖同源基因的正负调控作用相吻合。有137个小麦基因富集到11个分蘖相关通路中。本章节研究通过各项分析的筛选,逐渐精简了分蘖基因集合。2.获得分蘖相关ncRNA,丰富了已报道的小麦分蘖相关ncRNA数据库。鉴定得到4226个ncRNA,其中包括4131个lncRNA转录本和95个miRNA。通过多寡分蘖材料间差异表达以及靶基因富集到的分蘖相关通路分析,挖掘到了36个分蘖相关的ncRNA。本章节研究不仅丰富了小麦物种中的ncRNA集合,还填补了缺乏小麦分蘖性状相关lncRNA的空白。构建miRNA-lncRNA互作关系,为后续构建ceRNA网络打下基础。3.构建了WGCNA及ceRNA网络,获悉多种RNA互作模式。计算得到23个表达模块,筛选得到1个能够展现lncRNA-miRNA-mRNA互作的分蘖相关网络,其中包含了分蘖同源基因、候选lncRNA及差异表达的miRNA。构建了ceRNA网络,筛选得到3个包含分蘖同源靶基因的ceRNA网络。本研究将在小麦转录组中表达的多种RNA联系在了一起,为后续从不同RNA角度入手的分蘖相关研究提供了多维度参考。4.开发多态性SSR标记及软件,服务于后续分蘖基因研究。筛选得到12个SSR作为候选的分蘖基因相关分子标记,这些标记在两对近等基因系中均呈现多态,在两个多分蘖材料与两个寡分蘖材料中分别一致的,与近等基因系背景相吻合。同时还开发了用于多态性SSR标记挖掘的软件,为后续开发能够区分多寡分蘖基因型的分子标记奠定基础,也为开展SSR标记开发的科研人员提供了更为便捷的工具。5.测试及比较SSRMMD软件性能,证明了其运算高效、计算结果精准的特点。SSRMMD具有较低的算法复杂度,充分支持多线程并行运算。与其他同类软件相比,SSRMMD在运行效率及灵敏性上具有明显优势。在扩增出的56对引物中,有44对(约79%)在CS和AK58中发现多态性,表明SSRMMD具有较高的准确性。该软件已发表学术论文,并被其他科研人员引用。