智能计算在蛋白质分析中的若干应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:chengl1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是人体中每个细胞的重要组成成分,它是生命活动的主要执行者,调控着整个生命过程。蛋白质组测定和数据分析可以监测人体生理状态发生变化时蛋白质种类和数量的变化,帮助我们了解人体的机理和状态,具有很重要的意义。蛋白质除了在人体中发挥着重要的作用,还可以帮助化工、医疗以及制药等领域提高生成效率。但由于酶(蛋白质)本身的特性,它们一般都无法直接应用于体外复杂的化学体系中,这是因为酶可能出现不稳定或者反应条件苛刻等情况。目前改善酶的特性主要通过定向进化实现,而定向进化中的计算方法是提高定向进化生成蛋白质的效率与可用性的重要工具。本文主要从蛋白质组测定后的数据分析和定向进化中同源蛋白库的构建这两个方向所需的计算方法进行研究,主要的特色工作包括:(1)针对DIA(Data Independent Acquisition,数据非依赖性采集)数据的无目标分析提出了一种基于卷积神经网络的MSCNN(Mass Spectrometry Convolutional Neural Network,质谱卷积神经网络)预处理模型。该模型与DIA-Umpire中的模型相比,能充分利用肽段在MS1(First stage of Mass Spectrometry,一级质谱)和MS2(Second stage of Mass Spectrometry,二级质谱)中的特征,更有效的去除DIA数据中的噪声峰,对后续分析有显著的帮助。(2)针对RTF平台DIA数据的有目标分析中的预处理和蛋白质定量问题分别给出一种均匀提取预处理算法和提出了一种基于最小平方误差的蛋白质定量模型,并通过图谱的TIC(Total Intensity Current,总离子强度)图变化以及两个样品的相对浓度比分别证明了这两种方法的有效性。(3)针对同源蛋白库构建中的逆翻译过程给出一种多目标优化的解决方法。我们将逆翻译过程模型化为多目标问题,并用经典的多目标优化算法NSGA-Ⅱ解决,最后通过荧光蛋白亲本序列的模拟仿真实验证明了这种方法相对于常规的分段算法有很大的性能提升。
其他文献
目的:克隆并表达结核分枝杆菌重组融合蛋白Pst S1-Hsp16.3,建立基于重组融合蛋白Pst S1-Hsp16.3的纳米金免疫传感器和可视化免疫传感器,评价其诊断结核病的效率。方法:根据Ge
中医医院绩效管理的成功与否决定着其在医疗服务市场中占据什么样的地位,然而,随着医疗市场竞争的日渐激烈化,中国医学的传承者——中医医院面临着严重的发展困境。因此,为了
石油被称为“工业的血液”,虽然现在全世界研究出风能、电能、核能等很多新的能源,但依然撼动不了石油在工业行业中的主导地位,这也决定了石油依然是无可取代的重要能源,本文
紫色土是亚热带地区的一种非地带性土壤,也是我国南方重要的旱作土壤之一。四川地区的紫色土硝化作用强烈,保氮能力弱,硝态氮淋失和径流损失是其重要的氮损失途径和污染来源
随着现代工业技术的进步,纤维增强复合材料因其抗拉强度大、密度小、重量小、耐腐蚀性能好、抗疲劳性能优异等特点,在各个工业领域中被广泛使用。在一些结构应用中,纤维增强
由于聚电解质具有独特的环境响应特性,在药物控释、非线性光学材料和光学电子器件等领域有着良好的应用前景。本文主要利用Langmuir膜天平技术和原子力显微镜对两种二嵌段聚电解质聚丙烯酸正丁酯-聚丙烯酸(PnBA-b-PAA)在空气/水界面的聚集行为及其Langmuir-Blodgett(LB)膜表面形貌进行了系统的研究。考察了铺展溶液浓度与体积,亚相温度、pH和离子强度以及共聚物组成等因素对PnBA
近些年来,随着新能源汽车的快速发展,镍氢动力电池以其高安全性而倍受青睐。RE-Mg-Ni基储氢合金作为镍氢动力电池的关键材料之一,也已然成为研究的热点课题。本文研究了A5B19
花生(Arachis hypogaea L.)又名“长生果”、“落花生”,起源于南美洲。在我国,它不仅是重要的经济作物而且是北方地区的主要油料作物。长期以来,我国花生的产量稳居世界首位
为了研究肠膜蛋白对黄鳝(15.47±0.19g)生长,肠道物理屏障及肠道炎症的影响,本实验设置两个不同鱼粉水平的饲料配方:42%,22%;并于每个鱼粉水平上分别添加0%,2.5%,5%肠膜蛋白,
锂离子电池由于其能量密度高、工作电压高、使用寿命长等优点,已成为当前使用最为广泛的储能电池。其中,负极材料在锂离子电池中起着至关重要的作用,目前商业化的石墨负极材