基于经验贝叶斯和广义隐马尔可夫模型预测植物多聚腺苷化位点

来源 :厦门大学 | 被引量 : 0次 | 上传用户:fugaowen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物中,多聚腺苷化(poly(A),polyadenylation)是基因表达的重要过程,也是形成成熟mRNA的关键步骤。Poly(A)位点标识着基因末端,对其精确识别有助于基因结构预测、基因注释、基因调控等基因组分析。含有多个poly(A)位点的基因进行位点选择的过程称为选择性多聚腺苷化(APA,alternative polyadenylation)。同一基因在不同细胞状态下对不同poly(A)位点的选择对mRNA的功能,如将mRNA从细胞核转运到细胞质、增强mRNA的稳定性和调节mRNA的翻译等都至关重要。特定位置的poly(A)位点的选择与加工复合物的稳定性以及mRNA的信号序列有关,而加工复合物的稳定性又取决于剪切位点周围的poly(A)信号强度。在动物poly(A)信号中,位点附近的特征序列保守性高,如在动物poly(A)位点上游AAUAAA六联子及其变体模式所占比例超过80%。相比之下,植物poly(A)信号的保守性低,如AAUAAA所占比例仅约10%。目前针对动物的poly(A)位点预测工具远多于植物的,而对植物的poly(A)位点预测方法仅局限于对poly(A)信号的一级序列分析与建模,未能考虑高通量测序得到的剪切位点的微观不均一性或是信号强度不同的poly(A)位点的模式特征,在全基因组水平对植物poly(A)位点的计算机识别仍是一个挑战。本文结合经验贝叶斯统计理论和广义隐马尔可夫模型提出poly(A)位点预测模型(称为Bayesian-GHMM),将下一代测序技术产生的高通量poly(A)位点序列聚类成剪切位点簇(PAC,poly(A)cluster),并提取poly(A)位点信号模式,以预测poly(A)位点。首先基于经验贝叶斯的统计方法将poly(A)序列聚类成PAC,并根据基因中PAC的表达水平将位点划分成为strong和weak两个组别。然后对不同组别的PAC提取不同元件区域的poly(A)信号模式,并分析不同组别、不同基因区域的信号模式差异。最后基于不同组别的poly(A)信号模式确定模型的基本参数,构建广义隐马尔可夫模型,并利用前后向算法预测植物的poly(A)位点。实验结果表明本文提出的Bayesian-GHMM模型能高效地处理大规模新一代高通量测序数据,通过分组poly(A)位点和提取不同区域的poly(A)信号模式,实现poly(A)位点预测,在模式植物拟南芥中预测特异度和敏感度比已有模型综合提高了 6%。通过构建计算机识别模型,从高通量生物数据预测poly(A)位点,有助于辅助生物实验筛选重要基因的位点,提高生物实验效率。
其他文献
近年来,伴随着我国经济实力的不断增强,金融市场监管的逐步完善,目前我国已经成为了仅次于美国的全球第二大、亚洲第一大私募股权投资市场,截至2019年12月底,我国目前已备案私募股权投资基金28490只,备案基金规模85932亿元。在目前强监管的环境下,伴随着国内日益增长的高端理财需求和优质私募投资资产荒形成了鲜明对比。对于一个专业投资者或投资机构来说,拥有专业的判断投资能力变得尤为重要。因此,本论文
学位
目前,固态纳米孔由于结构稳定、尺寸可调,在DNA测序、生物分子和离子检测中展现出广阔的应用前景。纳米孔因其内凹型内壁结构,其电导性能在纳米空间内受表面电荷的影响尤为明显,可为基于表面电荷的检测技术带来更高的灵敏度。本文以研究基于表面电荷检测的玻璃纳米孔为研究对象,着重研究了浓度梯度的设置在表面电荷检测中对电学性能及检测灵敏度的影响,最后通过流动电势的检测来验证纳米孔的表面电荷变化趋势。本文主要开展
学位
目前,商业化使用的纳滤膜普遍要求其具有较高的渗透通量、较强的分离性能和低的组装成本。增强纳滤膜的分离性能,提升纳滤膜的稳定性依旧是纳滤膜研究的主要问题。通常,通过哌嗪(PIP)和均苯三甲酰氯(TMC)之间的界面聚合在高分子多孔基质上形成超薄分离层来制备聚酰胺纳滤膜。然而,由于界面聚合形成的分离层十分致密,造成纳滤膜通量较低。为此,针对聚酰胺复合膜通量较低、稳定性差的问题,本文采用云母纳米片、聚乙烯
学位
减少航空维修工程中人员的不安全行为对提高飞机安全运行水平意义重大。计划行为理论作为行为研究的经典理论已经被提出很多年,然而该理论在航空维修行为研究中的应用目前主要还是西方国家在开展,国内对这方面的应用还不够成熟。为了更深入地研究航空维修人员在维修中的不安全行为机理,本文基于计划行为理论建立了航空维修工程中人员不安全行为意向模型,对航空维修工程中人员的不安全行为进行研究探讨。首先在航空维修工程人员的
学位
维甲酸受体(Retinoic acid Receptorα,RARα)是一类非类固醇核受体,它作为转录因子在配体诱导下参与调控细胞增殖、分化、代谢、凋亡等多种生理过程。RARα表达或定位的异常与肿瘤的发生、发展密切相关。如超过95%的急性早幼粒细胞白血病患者是由于15号染色体上的PML基因与17号染色体上的RARα基因发生易位所表达的PML-RARα融合蛋白导致。组蛋白去乙酰化酶6(Histone
学位
目的 比较腰椎融合内固定术治疗退行性腰椎疾病中半椎板和全椎板减压方式对邻近节段退变的影响。方法 跟踪随访我院2016年1月-2017年10月期间收治的诊断为退行性腰椎疾病而行后路椎间融合固定的患者60人,分析人口学特征,手术相关指标(手术时间、失血量、术后引流),邻近节段退变(Adjacent Segment Degeneration,ASD)的影像学指标(椎间隙高度、动态成角、前后滑移距离)的和
学位
私人银行业务被誉为零售业务“皇冠上的明珠”,在国外有着数百年的发展历史。国内私人银行市场以商业银行私人银行部门为主要服务提供机构,经历了十余年的迅速发展,目前私人银行业务也已成为商业银行零售业务的核心之一。高资产净值群体成为国内私人银行竞相吸引的对象,谁能为他们提供更专业化,更个性化的财富管理服务,谁就能更好的树立品牌形象,占领更多的市场份额。整体上,我国的私人银行业务仍位于发展初期阶段,各商业银
学位
近年来,深度强化学习已成为人工智能领域的一个研究热点,在理论和应用方面都取得了较为显著的成果。但现有的深度强化学习算法仍存在样本利用率低,稳定性差,探索-利用困境等问题,在未来依旧面临着许多挑战。因此,对深度强化学习算法的深入研究具有重要的意义。本文主要围绕深度强化学习算法所存在的一些问题展开研究,在基于模型和无模型两类方法的网络结构,训练方式和探索策略等方面进行改善,并同时考虑两类方法的有效结合
学位
随着客车市场竞争日益激烈,企业加大控制成本力度,提高企业的盈利能力。考虑油漆供应商单一、油漆报价不一,企业急需寻找并引入新的供应商,执行AB角供应,增加竞争,建立报价模型,降低成本。因此,如何降低客车油漆成本,在保持客车的可靠性和安全性的同时,又提升客车整体美观,成为企业的新课题,展开客车油漆的材料筛选及整车试装与成本管控的研究迫在眉睫。本研究结论对客车企业油漆筛选实践具有一定的指导意义。本文的研
学位
PMMA(聚甲基丙烯酸甲酯,poly(methylmethacrylate))俗称有机玻璃,是质地优异的合成透明材料,已经被广泛的应用于日常生活和工业生产中。由于其价格低、透明等优点,近年来被作为固体推进剂应用于各种新型发动机实验中。对固体燃料的热解反应机理以及热解气的燃烧机理的准确描述是燃烧数值计算中准确预估固体燃料退移速率、发动机点火性能和维持火焰稳定的关键因素。本文采用热重/光电离质谱实验平
学位