植物多聚腺苷化的位点预测及其调控机制的全基因组分析

来源 :厦门大学 | 被引量 : 0次 | 上传用户:smeie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
mRNA多聚腺苷化是真核生物基因表达的一个重要步骤。多聚腺苷化位点(Poly((A)位点)标识着基因末端,对其准确识别有助于确定基因结构。如果一个基因含有多个poly(A)位点,则可以通过这些位点的差异选择(选择性多聚腺苷化,APA)改变其表达的mRNA的性质,APA在基因表达的后转录调控中起重要作用。许多研究估计APA在基因组中可能广泛存在,但目前仍无全基因组水平上APA形式、APA位点分布、基因中的APA程度等方面的信息。   本文基于传统EST/cDNA数据以及poly(A)定位的下一代测序技术产生的高通量数据,预测植物poly(A)位点、识别其信号模式,以及从全基因组水平上分析APA相关机制。主要研究内容有:   1.植物poly(A)位点预测   通过由EST/cDNA得到的拟南芥、水稻以及衣藻的poly(A)位点序列,基于植物poly(A)位点信号区域分布建立了三种poly(A)位点预测模型,包括基于分组的广义隐马尔可夫模型、广义隐马尔可夫-实小波变换模型以及基于贝叶斯网络的分类器模型。分别估计了相应模型参数,预测不同物种的poly(A)位点,数据实验均获得了较高的敏感度和特异度,证明了模型的有效性。   2.Poly(A)信号模式识别   为研究poly(A)位点,特别是APA位点的特性,建立了poly(A)信号模式识别及可视化流程,综合扫描式模式搜索、熵等方法筛选模式,基于编辑距离进行层次聚类,通过多序列对齐将模式聚集成模式集合,并使用位置特异性分值矩阵及Logo图形直观表示。应用该流程提取了拟南芥、水稻以及衣藻的poly(A)位点信号模式,比较了不同物种、不同基因区域、以及不同组织下APA位点的信号模式差异,并将识别出的模式用于poly(A)位点预测。结果表明该流程能筛选出有效的poly(A)信号模式,并能大大提高位点识别的准确率。   3.全基因组水平选择性多聚腺苷化调控研究   基于polyt(A)定位的下一代测序技术产生的拟南芥海量序列,定量分析了选择性多聚腺苷化相关机制及基因表达差异。首先实现集高通量序列预处理、双末端序列循环比对、poly(A)位点提取的流程,建立迄今最大的拟南芥poly(A)位点数据集,并通过不同平台包括大规模平行测序技术、表达序列标签、基因芯片以及生物实验的验证,证明了该数据集的有效性。   基于提取的数据集,发现大量APA位点,特别是位于非3’UTR区域的APA位点,围绕生物学家感兴趣的各类多聚腺苷化相关问题从全基因组水平定量综合分析。(1)基于位点的强度对poly(A)位点进行分类,分析各类位点使用不同保守性的poly(A)信号模式的情况;使用建立的poly(A)信号模式识别流程分析及比较不同APA位点的信号差异;(2)探索多聚腺苷化与剪接的关系,研究发生APA的内含子和外显子的特性,分析剪接位点保守性;(3)根据APA发生区域及方向,将其划分为不同类别,包括不同基因区域的APA、启动子区域的APA,以及反向APA;并分析及比较不同类别中的APA特性;(4)分析不同条件下的APA位点使用差异及基因表达差异,使用双加权标准化方法对不同条件下的poly(A)位点及基因表达水平进行标准化;使用数理统计方法分析叶子组织和种子组织的APA差异性以及基于负二项分布的统计检验模型检测差异表达基因。分析结果揭示了拟南芥APA全基因组水平的概况,包括未预料到的以及全新的APA形式,同时也确证了其它报道指出的拟南芥反向转录本的广泛存在,表明APA在基因表达中的作用远超过预期。   最终可将模型算法分析与生物实验结合,研发集高通量测序序列预处理及poly(A)位点提取、poly(A)信号分析、poly(A)位点预测、APA机制分析以及基因表达差异分析于一体的分析流程,达到有效辅助生物实验的水平,以促进全基因组水平上的基因调控研究。这些数学算法、模型以及这套分析流程将很容易扩展应用于不同物种(如酵母、老鼠等)及相似的下一代测序技术(如RNA-Seq)产生的海量数据中。本文的研究对于对于基因组注释以及后转录基因调控机制的研究都有重大意义。
其他文献
带式干燥床干燥过程中物料的水分含量是干燥工艺的核心问题,物料水分的均匀性直接决定了生产成品的效率。而传统的控制方式只是单纯地设定干燥时间,这样无法保证干燥物料水分
随着科学技术的发展与人类研究水平的提高,结合智能机器人技术与人类双耳机理模型,针对声音的全向性及衍射等特性,听觉感知机器人的研究已成为很多科研院所及高校的重要研究焦点
在钢铁企业的生产过程中,生产计划与调度的优化是实现其产品质优价廉、准时交货的重要途径之一。炼钢-连铸是钢铁生产的瓶颈工序,科学地制定生产调度计划可以提高设备率,减少
随着脑科学和计算机科学研究的迅猛发展,脑-机接口技术取得了长足的进步。脑-机接口是一种不依赖大脑与外周神经和肌肉组织正常输出通道的通信系统。脑-机接口能够为那些具有
随着经济和对外贸易的飞速发展,物流行业通过对货物在时间和空间上的转移创造了很高的经济效益。仓储是物流的重要组成部分,由于科技和工业生产的不断进步,传统仓库已经不能
本课题立足于目前国内外多媒体通信操作终端的研究现状和对多媒体通信操作终端的相关理论和技术的深入研究与探讨,提出了一种基于S3C6410处理器、WinCE环境的多媒体通信操作
随着web网页的迅速发展,海量的网络信息大量涌现,如何在繁杂的信息中快速找到需要的信息是网页自动分类研究的重要内容。由于文本分类技术研究开始的时间较早,目前已经拥有相对
随着计算机软硬件技术的发展,嵌入式控制技术的发展也越来越快,嵌入式系统在工业控制中的应用也越来越广泛,但采用组态技术,实现基于嵌入式系统控制和监控功能的相关技术缺乏
刀具预调测量仪是加工中心和数控机床等大型加工设备必要的辅助设备。随着数控机床、加工中心等加工设备在我国使用量越来越大,使得能够测量刀具参数的刀具预调测量仪的需求
随着计算机技术和通信技术的飞速发展,越来越多的企业开始利用高度发达的信息技术快速、准确、高效地整合整个企业的资源,从而降低生产成本,提高产品质量和服务水平,提高企业