植物Poly(A)位点和直系同源基因数据可视化与识别算法研究

来源 :厦门大学 厦门大学 | 被引量 : 0次 | 上传用户:lishicun2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信使RNA(mRNA)多聚腺苷化是真核生物基因表达的一个重要步骤。Poly(A)位点(多聚腺苷化位点)标志着基因表达的末端,对于研究基因表达、基因注释、基因调控等有重要的价值。对于poly(A)位点的相关研究不仅可以帮助人们了解真核生物基因3末端序列的调控机制,更有助于人们理解基因转录和基因表达的相关原理。  直系同源基因是分布于两种或两种以上物种基因组中,由于物种分化而享有共同祖先的同源序列。通常认为不同物种中直系同源基因功能高度保守,在基因序列编码、结构和生物学功能上极其相似。基因进化历史的重现和物种新发现基因的功能预测等都依赖于不同物种间直系同源基因集群的识别。  本文利用计算机和网络手段来处理、分析和展示海量的生物学数据,挖掘隐藏其中的知识和信息。本文面向植物多聚腺苷化位点数据平台及识别算法和植物直系同源基因数据平台及识别算法两个具体问题进行了研究。主要研究内容有:  1.提出了模块化的多聚腺苷化位点识别框架,搭建了在线poly(A)位点识别平台PASPA。本文设计了包含算法选择、模型构建、参数估计、多聚腺苷化位点识别、EST序列基因组定位(对拟南芥、衣藻和水稻)和数据在线展示六个数据处理步骤的识别框架。针对拟南芥、水稻和藻类EST数据特点,本文设计了动态的带标记折线图来显示EST序列的打分以及poly(A)位点识别结果。  2.基于广义隐马尔可夫模型(Generalized Hidden Markov Model,GHMM),通过对不同物种中poly(A)信号模式的研究,本文实现了高精度、面向多物种的多聚腺苷化位点识别工具——PASS2.0。相比同样基于GHMM的PASS1.0等算法工具,PASS2.0不仅提高了在拟南芥和水稻物种上的识别精度,还提出了针对不同物种的参数估计方法,提高了算法的适用性。  3.提出了通用的植物直系同源基因数据处理流程框架,搭建了植物直系同源基因数据平台PlantOrDB。框架基于模块化的设计思路,处理环节之间相互独立,方便用户根据需求自定义功能模块和更新处理算法、工具。本文提出的数据处理流程框架主要包括数据处理、在线分析和数据展示三部分。针对基因家族数据特点,设计实现了系统发生树与多序列比对结合展示的图形化控件。  4.基于系统发生树的思路,提出了一种直系同源基因识别算法。针对基因家族中直系同源基因识别困难以及系统发生树方法固有的人工干预问题,引入RBH(双向最优匹配)算法快速识别不同物种间的直系同源基因关系。针对最耗时的All-against-all BLAST环节,引入多核心并行处理,提高了算法速度。针对基于CAOS算法的在线处理流程,引入MAFFT7快速重建多序列比对,提高了在线处理算法的效率。  本文搭建的植物多聚腺苷化位点识别平台(PASPA)和植物直系同源基因数据平台(PlantOrDB)为相关的科研领域提供了丰富的数据资料和处理方法,满足了相关研究人员的研究需求。PASPA和PlantOrDB一方面提供了丰富的数据资源,另一方面集成了各种算法和处理工具。生物学家可以通过图形化交互界面提交数据并且调用算法工具处理,免去了在本地计算机安装编译软件的烦恼。PASPA和PlantOrDB高度的可视化界面和良好的交互性使得不具备计算机基础的生物学家也能够毫无障碍的运用计算机算法来处理数据和挖掘知识。综合来说,本文的工作能够让一线的生物学家们摆脱计算机水平和实验条件的限制,专注于他们感兴趣的信息去发掘知识。这一点是我认为本文工作最大的意义所在。
其他文献
当下的经济和工业快速发展使得矿产资源的需求快速增加,同时尾矿库的数量也随之增长。由于运行期间坝高和库容都会上升,尾矿库逐渐变为潜在的高势能危险源,对矿山和选矿厂本
3D拍摄相对于传统的2D拍摄,不仅能获取高度和宽度信息,还能感知深度信息,是三维世界最佳的记录形式。然而,现有3D拍摄设备的立体成像范围有限,同时存在立体拍摄参数获取困难,动作调
知识获取是专家系统乃至人工智能的一项重要的研究内容。在知识获取过程中,纯粹以文字来组织知识不仅困难而且无法展示知识的全貌。尤其对于专家头脑中的隐性知识,用纯文字记录
Subject Code:E02 With the support by the National Natural Science Foundation of China,recently,a study by the research group led by Shi Jianlin(施剑林)and Bu We
针对传统视觉测量系统受相机分辨率及视场限制,不能兼顾测量空间及测量精度的问题,本文基于多视图几何约束原理,研究了一种现场条件下的大尺寸视觉测量技术。通过手持单个数
随着老龄人口的不断增加,低视力问题也越来越明显,故能提高视觉能力的电子助视器在生活中发挥着重要作用。随着FPGA技术的发展,FPGA逐渐进入数字图像处理的应用领域。因此,展
当今用电系统发展迅猛,人们对用电系统的安全性和稳定性以及用电容量提出更高的要求,所以大型的电力变压器在此系统中扮演的角色变得更加重要。因电力变压器的突发故障造成的停电现象所带来的经济损失是不可估量的,保证大功率变压器的正常运行、及时检修、及时发现问题、预测其老化状态和运行寿命具有重要意义。此外,由于变压器的成本很高,而且体积大,重量数百吨,运输、安装难度较大,因此提高变压器的使用寿命已成为国内外学
尊敬的《销售与市场》编辑部全体人员:你们好,接触《销售与市场》杂志已有数载,从原来的学术风格到眼下的潮流与模式的引领,都在潜移默化中带给营销人专业的视角和内容。之前
冷轧薄板的质量控制在冷轧板生产中越来越受到重视。传统的接触式板形检测方法难以或无法满足快速准确的检测精度,而且造价高,备件昂贵,维护费用较大。针对接触式板形检测技
随着机器视觉技术日臻成熟,贴片机已广泛采用了机器视觉系统来解决细间距器件的精确贴装问题。视觉系统的主要作用是PCB(印刷电路板)的精确定位、器件定心及对准和器件检测。