机器学习辅助的肌酸酶的突变进化分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:feihuiy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肌酸酶在临床上常被用于测定肌酐以此来评估肾脏功能,在工业生产中也有不可替代的催化作用。但该原始蛋白酶为常温酶,即无法在高温环境下起到较好的催化作用,且其自然进化速度较慢。因此,在实验室模仿自然进化的关键步骤对蛋白酶合理设计序列突变,使其即使在高温条件下也能够具有较好的催化活性,即提高其热稳定性,是当前研究的重要方向。蛋白质空间结构的多样性是目前已知的对于序列热稳定性最直接的影响因素,而蛋白质序列又唯一确定其结构空间。因此,我们从序列出发,希望通过实验对序列中部分位点进行氨基酸突变,生成新的序列来提高其热稳定性。我们实验室在先前研究的一种无系统发育偏见的共识方法的基础上,获得了 18个与热稳定性相关的重要突变位点,每个位点需要突变的氨基酸已经确定,即每个位置只需选择突变或者不突变,因此共有218种选择,庞大的数据量难以仅靠人工实验测定其热稳定性值。而最新提出的利用机器学习辅助蛋白质突变进化的策略可以帮我们解决上述筛选瓶颈的问题。本文利用机器学习技术,通过对已标记序列,即实验室已测定热稳定性值的序列,进行编码后建立序列与热稳定性之间的映射模型,随后挑选合适的模型以及获得一系列组合模型来对未标记突变序列热稳定性进行预测。根据预测结果寻找预测值相对较高的突变体,并提交给实验室进行人工测序验证,最终帮助实验室获得了热稳定性显著提升的优质突变体,突破了工业和临床应用的限制。本文所用的序列数据均来自于合作对象上海交通大学生命科学学院实验室的最新观测数据。我们通过人工智能辅助蛋白质突变的技术帮助实验室寻找到了最佳突变体,为工业和临床提供了热稳定性显著提高的肌酸酶突变体,同时减轻了实验室筛选工作量,具有实践意义。在最终模型选择的方式上,不同于以往相关文献中,只依靠蛋白质性能预测模型在测试集上的指标评分来选择最优模型,本文创造性的利用了模型组合的方法。我们挑选了一些在测试集评分较高的模型作为组合的候选模型,通过真实的性能值来计算其组合权重,获得了一系列组合模型以及权重较高的重要模型,这些模型进一步提高了预测准确度,也为日后更好的预测蛋白质性能提供了新思路。
其他文献
在经济全球化的背景下,各个国家或地区的金融市场联系密切,金融危机一旦爆发将通过各种渠道逐步向外扩散传染,波及范围广且危害深远。若能证明金融危机传染的存在性,并及时判断传染的强度及方向,这对于国家在面对金融危机传染时进行风险管理与控制、维护金融市场安全意义深远。本文聚焦于金融危机跨国传染现象,从非线性角度入手,应用动力学系统间的非线性相互依赖性研究金融危机通过多重渠道在国家间的传染现象。具体的方法为
学位
波浪能作为一种清洁能源,具有能量密度高、分布面广等优点。渤海周边波浪能密度低,同时波浪周期长,速度低,导致发电机的功率密度低。直线永磁游标波浪发电机(linear permanent magnet vernier generator,LPMVG)具有低速、高功率密度的优点,能较好地解决发电机功率密度低的问题。本文面向小功率离网型波浪能发电系统,针对其对发电机输出功率和运行安全性的需求,提出了一种错
学位
目的 探讨采用如意金黄散联合泡沫敷料外敷对预防术中获得性压疮的安全性和有效性。方法 选取2021年11月-2023年4月于山西中医药大学附属中西医结合医院进行手术的患者200例,在组间年龄、性别匹配的原则上,按照随机数字表法分为对照组和观察组,每组100例。对照组给予常规预防措施,观察组则在对照组的基础上,术中采用如意金黄散联合泡沫敷料外敷的方法预防。对比两组患者间压疮的发生率、白介素-6(IL-
期刊
双向AC-DC变换器作为房车电源系统重要的部件,既要在房车连接充电桩时为储能电池充电,又要逆变输出220V交流电供给交流负载使用。现有的双向AC-DC变换器体积大,成本高,效率低,难以满足车载大功率设备的用电需求。为此,本文以大功率、小型化的双向AC-DC变换器为研究对象,研究其拓扑工作原理、硬件设计、磁集成设计以及电压增益改进,并通过仿真及实验验证变换器的性能。为降低双向AC-DC变换器的成本,
学位
微电网是消纳分布式发电(Distributed Generation,DG)的重要载体。随着种类繁杂、性质各异的分布式电源在电力系统中的广泛应用,给微网的运行与调控带来了诸多挑战。一方面,微电网作为已逐渐规模化的电力电子化电力系统,电力电子接口的大量接入导致微网系统失去传统发电机组的惯量与阻尼特性,缺乏惯性支撑,扰动下的系统频率会出现恢复缓慢、偏移严重的问题;另一方面,大规模、小容量的新能源机组取
学位
对于我国北方高寒地区的桥梁施工,由于冬季严寒无法施工,同时冬季持续时间较长,受悬臂施工工期的限制,大跨度桥梁无法在一年内完成合拢。因此,我国高寒地区大跨度桥梁的悬臂施工常常会面临大悬臂过冬的问题。漫长的过冬期,结构面临大温差、雪荷载等诸多因素带来的安全风险问题。本文依托佳木斯松花江特大桥实际工程,对高寒地区桥梁施工期大悬臂过冬风险评估问题开展研究,主要研究内容如下:(1)总结了桥梁风险评估基本概念
学位
肝内胆管癌(Intrahepatic cholangiocarcinoma,ICC)是一种原发性肝癌,其发病率仅次于肝细胞癌。近些年来,肝内胆管癌的发病率在全球各地区都呈现出上升的态势。但由于发病症状不明显,通常缺乏特异性表现,所以患者在确诊时往往已经处于中晚期,错过最佳就诊时间。目前根据临床情况及检验结果制定的治疗方案主张在确保切缘阴性与剩余肝脏维持手术后肝功能的前提下,对肿瘤进行完整切除,即采
学位
我国高纬度地区大跨径桥梁的建设过程中经常遇到长大悬臂越冬施工问题,在漫长的冬季,桥梁结构将面临极端气候带来的诸多挑战。本论文针对矮塔斜拉桥大悬臂越冬期间遭遇的大风及流冰威胁,采用统计分析和数值模拟的方法,开展风-流冰联合作用下矮塔斜拉桥大悬臂结构的动力响应分析。论文主要进行了以下几个方面的研究工作。(1)开展我国高纬度地区河冰力学性能的研究。通过对现有河冰力学性能试验数据的统计分析,给出河冰强度和
学位
随着互联网金融的迅猛发展以及个人消费观念的快速转变,个人信贷业务的需求也随之快速增长,相应而来的个人信贷风险正逐步显露。相关借贷机构就需要快速应对、及时评估预测申请人的违约风险。而在已有的文献研究中,对于建模前数据的事先处理往往关注较少,只从建模本身去提升分类性能,对于最终的建模效果难以有新的突破,这一点促使我着力研究建模前的数据准备工作。与此同时,本文会采用线性加权的方式融合单一模型,构造组合模
学位
随着桥梁建设技术的不断进步,大跨径桥梁越来越轻柔,悬索桥作为目前跨越能力最强的桥梁结构形式,对风荷载的作用十分敏感。近年来,国内外多座大跨度悬索桥出现了涡激振动现象,虽然不会引发桥梁的突然坍塌破坏,但是涡振发生频率过高会导致构件出现疲劳破坏,严重威胁桥梁的运营安全和行车舒适性,造成不良的社会影响。调谐质量阻尼器(Tuned Mass Damper,TMD)是最常用的振动控制措施之一,当TMD频率调
学位