基于高通量测序的玉米基因组组装和水稻长非编码RNA识别与分析

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:a236540335
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着测序技术发展和测序价格降低,高通量测序技术被广泛应用于生物研究的各个领域。玉米和水稻是重要的粮食作物和模式物种,本论文基于高通量测序技术对Mo17和Zea mays ssp.mexicana的基因组进行组装,并对水稻中长非编码RNA进行识别和分析。研究主要内容如下:1.Mo17和Zea mays ssp.mexicana(mexicana)基因组组装利用Mo17和mexicana重组自交系材料,采用混合组装策略对Mo17和mexicana基因组进行组装。分别得到2.04 Gb(scaffold N50:3 Mb)Mo17基因组草图和1.20Gb(scaffold N50:107 kb)mexicana基因组草图。随后分别通过单拷贝直系同源基因标准集(BUSCO)、真核生物核心基因集(CEGMA)、禾本科高度保守的基因家族(core GFs)以及B73中已注释基因对Mo17和mexicana基因组准确性进行评估。虽然基因组序列整体上比B73基因组略差,尤其是mexicana基因组只组装出约50%序列,但是未组装出区域多数为重复序列,基因区域相对比较完整。结合从头预测和基于证据的策略分别对Mo17和mexicana基因组进行重复序列和基因结构的注释。Mo17和mexicana基因组分别含有79.7%和72.8%的重复序列。通过结合基因从头预测和基于证据的方法,分别在Mo17和mexicana中预测出了40,003和31,387个编码基因。基于全基因比对的共线性分析,在mexicana与B73 9号染色体上发现一个大约27 Mb(B73基因组片段大小)的倒位,通过与水稻共线性分析发现,mexicana中染色体状态更接近玉米祖先状态。利用PAML枝位点模型共检测到了310个正向选择基因。mexicana中检测到133个正向选择基因,mexicana中部分正向选择基因可能与高原环境适应性相关,其中正向选择基因ZMex05g020691和ZMex05g017761可能具有抗旱和抗冷的功能。识别出的mexicana中与适应高原环境相关的基因在玉米改良中具有潜在应用前景。结合基因组和群体的数据,在玉米中检测到10.7%的mexicana基因渗入区域,预示着mexicana对玉米适应性的提高具有一定的贡献。2.基于竞争性內源RNA(ce RNA)网络水稻基因间区长非编码RNA(lincRNA)功能注释LincRNA广泛存在于动植物基因组中,并在基因调控等很多生物学过程中发挥重要作用。本研究基于水稻磷胁迫条件下RNA-seq数据识别出3170个lincRNA座位(loci),包含3441个转录本。对其基本特征分析发现,相对于编码基因,lincRNA具有较低的GC含量。LincRNA外显子平均长度长于编码基因,但是lincRNA转录本的平均长度短于编码基因。基于竞争性內源RNA(ce RNA)理论,分别构建水稻根和茎的ce RNA网络。根ce RNA网络中包含4847个节点,其中511个节点为lincRNAs,网络平均连接度为13.12。茎中ce RNA网络中包含4979个节点,其中376个节点为lincRNAs,网络节点的平均连接度为25.57。对其进行网络社区挖掘并注释发现,大量社区功能富集在与磷胁迫相关的生物学过程中。通过lincRNA所在的社区对其进行功能注释。在根ce RNA网络中,121个lincRNAs的功能被成功注释,茎中有164个lincRNAs可被成功注释。结合网络和差异表达信息,挖掘根和茎中关键lincRNA,在根和茎中分别找到47和40个关键的lincRNAs,且在根中挖掘出4个功能直接注释为“细胞响应磷胁迫”的关键lincRNAs,通过网络挖掘出部分磷胁迫相关的社区及lincRNA。对根和茎中的关键lincRNA进行富集发现,lincRNA具有一定的组织和时空特异性,即lincRNA倾向于在磷胁迫响应特定过程或者特定时期起作用。3.珍汕97(ZS97)和明恢(MH63)中长非编码RNA(lncRNA)和反义RNA的识别及分析利用ZS97和MH63 RNA-seq数据,分别在ZS97中识别出8579个lncRNAs和1818个反义RNAs,包含17192和4276个转录本,在MH63中分别识别出8117个lncRNAs和1984个反义RNAs,包含17683和4427个转录本。进一步完善了ZS97和MH63的基因组注释信息。对lncRNA和反义RNA基本特征分析发现,相对于已注释的编码基因,lncRNA和反义RNA具有较低的GC含量、较短的转录本以及含有较少的外显子及较低的表达量。有趣的是,本研究得到的lncRNA和反义RNA的外显子和内含子的平均长度却大于已注释的编码基因。ZS97和MH63之间的lncRNA和反义RNA的保守性分析发现,ZS97和MH63之间分别有3473和847个序列相似的lncRNAs和反义RNAs,分别占ZS97和MH63的lncRNA总数的40.48%和42.78%。ZS97和MH63之间存在1507和435个位置一致的lncRNAs和反义RNAs,分别占总数的17.57%和18.57%。ZS97和MH63之间的lncRNA和反义RNA具有较差的保守性。
其他文献
对果树生产造成影响的主要气象因子有温度、水分、光照、风等。一、温度1、果树的地理分布受温度条件限制,其中主要的是年平均温度、生长期积温和冬季最低温。冬季低温是关系
汉代崇尚儒学,以经治国,儒家思想渗透到社会生活的各个方面。儒家强调天人合一,重视人与自然的统一,注重生态环境保护,对汉代产生了深刻的影响,使汉代统治者十分注重生态资源的保护
“天人合一”思想在当代环境问题的哲学思考中,受到世人的关注和研究。本文概略地介绍了“天人合一”思想的历史演进,主要流派,基本格局及其根本特点,以“天人合一”自然观为基础
观察力是人在长期的观察活动中逐渐形成的。它有一个不断充实、完善和提高的过程。培养观察能力是初中生物教学中的重要教学目的之一。那么如何培养学生的观察力呢?一、给学生
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在现代的二胡音乐中,移植曲目是提升和创造演奏艺术的一种方式,对二胡演奏艺术发挥了重要的推进作用。是完善和发展现代二胡演奏艺术的力量。为了更好的了解二胡演奏艺术的发展
高产是水稻遗传育种的重要目标。水稻产量由分蘖数、千粒重和每穗实粒数构成,此外,株型对水稻产量也有重要的影响。QTL定位以及图位克隆是发掘新基因的重要手段。利用前期024
在建筑节能评价中,建筑有时需要进行实际耗热量与标准耗热量的权衡判断。在新疆地区,依据规范中透明围护结构耗热量计算公式的计算结果显示南向外窗为得热构件,但是通过ECOTECT
随着测绘工程专业教学内容的改革,控制测量学升级为大地测量学基础,且在课时压缩的情况下,如何保证大地测量学基础的教学质量成为测绘工程专业教学过程中的重要问题之一。文中分别在教材选取、教学方法与手段以及教学实习方面对大地测量学基础课程进行了改革。通过改革,提高了教学质量,使学生较好地掌握了所学理论知识,同时也提高了学生实际操作技能。