基于直接RNA测序和机器学习解码小麦表观转录组

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:mm963258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以N~6-甲基腺嘌呤(N~6-methyladenosine,m~6A)为主的RNA修饰在大量研究中被证明是生物体基因转录后调控的关键因子。目前基于二代测序的检测方法都仍存在局限,如:基于抗体的m~6A-seq(或称为Me RIP-seq)只有100至200碱基的分辨率,通过RNA抗体交联(基于CLIP的方法)或酶促修饰(如DART-seq)的方法只能间接推断修饰位点,利用内切核酸酶的方法(如m~6A-REF-seq或MAZTER-seq)只能检测到符合其模体的部分。纳米孔直接RNA测序可记录RNA分子的电流信号,从而能够利用机器学习检测RNA修饰。然而,目前用于从直接RNA测序中检测m~6A修饰的方法依旧无法与基于二代测序检测RNA修饰的方法保持一致。本论文基于机器学习方法,在直接RNA测序数据上构建了一个单碱基精度m~6A修饰检测模型CatMOD,并利用CatMOD在六倍体中国春(Chinese Spring,CS)小麦上展开应用研究。具体研究结果如下:CatMOD模型构建与特征分析基于直接RNA测序和Me RIP-seq构建高精度m~6A修饰数据集。集成基因组序列特征、测序碱基质量特征、序列比对特征和电流信号特征,利用基于决策树的模型CatBoost开发了单碱基精度m~6A修饰检测方法CatMOD。进一步特征重要性分析发现,不同类型之间的特征通过相互作用的方式提高了模型的m~6A修饰检测效力,CatMOD模型捕捉到了m~6A修饰在直接RNA测序数据各个层级上的标记。小麦全基因组m~6A修饰位点的分析将CatMOD应用于六倍体中国春小麦直接RNA测序数据,在全基因组范围内检测到92054个m~6A修饰位点,进一步分析发现终止密码子和多聚腺苷酸化信号直接参与RRACH模体的构成,同时m~6A修饰在靠近翻译起始位点的5’UTR区域、终止密码子附近、3’UTR区域、以及LINE转座子的3’末端都有特异性富集。进一步分析m~6A修饰与基因拷贝数关系发现,m~6A修饰倾向于发生在多拷贝基因中,但在小麦三联体(Triad)中未发现明显的修饰偏好。综上所述,本论文开发了一款基于机器学习的单碱基精度RNA修饰检测方法CatMOD,并在异源六倍体小麦上展开了应用研究,为直接RNA测序数据的单碱基分辨率RNA修饰的生物学功能研究提供了新软件。CatMOD的代码和使用说明可从https://github.com/CatMOD/CatMOD获取。
其他文献
腐烂病是苹果产业中的重大真菌病害,其病原菌主要是子囊菌门的黑腐皮壳菌(Valsa mali)。腐烂病的广泛传播对苹果种植产业造成了严重的经济损失,为了深入探讨V.mali的侵染定植、感染致病及其防治策略,本研究通过V.mali的全基因组测序与比较基因组学分析,结合基因组代谢网络的模型预测,从基因组层面及其相关代谢通路预测着手,分析V.mali的侵染机制和致病机理,旨在为苹果树腐烂病的防治提供理论依
学位
霸王复合体隶属于蒺藜科(Zygophyllaceae)霸王属(Zygophyllum),是中国西北干旱生境植被的重要组成成分之一,在维持荒漠生态系统的稳定性方面起着至关重要的作用。然而由于环境变化和人类活动等影响,霸王复合体在过去30年里分布规模急剧减小。因此对我国霸王复合体群体遗传多样性、遗传结构与分化、群体动态等基本问题的研究将为其保护及可持续利用奠定重要的科学依据。此外,霸王复合体存在一个基
学位
转录延伸因子复合体(Elongator complex)是一种多功能复合体,由六个亚基组成(ELP1/2/3/4/5/6)。转录延伸因子复合体参与DNA的转录、复制、细胞的胞外分泌、细胞内组蛋白的乙酰化等多种生理生化活动。转录延伸因子复合体负责合成tRNA第34位尿嘧啶上的修饰(mcm~5s~2U、ncm~5U、ncm~5s~2U和mcm~5U),该功能被认为是当转录延伸因子复合体功能缺失后导致各
学位
目前,油菜多室性状的研究多见于普通遗传学分析,但关于植物多室性状的分子遗传机制研究结果基本来自拟南芥。本实验对芥菜型油菜两室亲本J248与多室亲本J163-4杂交与回交构建的BC5近等基因系单株花芽分化期茎顶端分生组织和开花时期不同大小的子房提取RNA,分别构建两个时期的多室与两室Bulk,依托Illumina Hiseq 2000平台进行转录组测序。研究目的在于鉴别出芥菜型两室油菜和多室油菜在花
学位
甘蓝型油菜是白菜和甘蓝杂交而形成的异源四倍体物种,是一种重要的芸苔属油料作物。与遗传背景相同的黑色籽粒相比,甘蓝型油菜黄色籽粒具有种皮薄、油分含量高、饼粕蛋白质含量高、色素和纤维素含量低等诸多优点。然而,在甘蓝型油菜中没有天然形成的黄籽品系,现有的黄籽种质资源都是远缘杂交或人工合成的。黄籽性状一般受多基因控制,遗传复杂,易受环境影响,选育优良黄籽品种难度较大。为揭示甘蓝型油菜种皮颜色形成的分子机制
学位
水稻是我国和世界上最重要粮食作物之一,一直以来,病害都是影响水稻产量和品质的一个重要因素。探索植物的抗病机理有助于控制植物病害的发生,减少植物病害所带来的损失。植物抗病反应是一个复杂的过程,涉及众多抗病基因和抗病相关基因。而与抗病基因相比,抗病相关基因具有持久抗性和广谱抗性的优点。本研究旨在对水稻中的生长素早期相应基因家族——水稻GH3家族第一组基因在抗病反应中发挥的功能进行初步探索,为水稻抗病机
学位
黄土高原地区是碱性石灰性土壤,土壤中铁的溶解度因较高的p H和高含量的碳酸盐而严重降低,明显抑制作物对铁的吸收和利用。间作可使作物间发生资源互补,在提高体系生产力、促进土壤养分活化和作物吸收利用、改变土壤微生物群落结构等方面起到了重要作用。间作是如何影响土壤-植物系统中铁的吸收利用以及相关的微生物学机制是什么还不是很清楚?因此本实验以大豆和玉米植株为实验材料,从野外采取土壤进行盆栽试验,利用各种生
学位
近年来,世界各国不孕率和生殖发育障碍发生率不断增加,生育率的下降、孕妇死亡率以及胎儿畸形率的提高,使得生殖发育障碍成为医学健康领域面临的重大挑战之一。事实上,与遗传因素相比,大多数生殖发育问题主要受到环境因素的影响,外界因素导致的生殖发育障碍约占总体发病率的80%。日常生活所接触到的外源性化学物质大部分具有生殖毒性,不仅会影响成年个体的生殖能力,还有可能破坏子代正常生长发育过程。分析外源性化学物质
学位
目的:探讨糖皮质激素吸入对支气管哮喘患者血清炎症因子及肺功能的影响。方法:选取商丘市第一人民医院2016年7月至2019年9月收治的支气管哮喘患者56例,按随机投掷法分为对照组和观察组。对照组实施茶碱缓释片+沙丁胺醇气雾剂治疗,观察组联用糖皮质激素吸入治疗,比较两组治疗前后血清炎症因子水平及肺功能指标改善情况。结果:治疗前,两组患者的白细胞介素–5(IL–5)、白细胞介素–10(IL–10)水平比
期刊
小麦(Triticum aestivum L.)是全球和亚洲地区种植最广泛的农作物之一,足迹遍布人们的饮食文化中,与人们的日常生活息息相关。然而,许多不稳定的环境因素都会影响着小麦的产量。因此,发掘植物中响应逆境胁迫的候选基因,再利用分子生物学的手段进行农作物遗传育种改良,对保证粮食安全具有重要意义。肽酶M24(Metallopeptidase 24,M24)蛋白家族在植物生长、应激反应和病原体防
学位