基于群智能方法的蛋白质结构预测研究

来源 :上海交通大学 | 被引量 : 1次 | 上传用户:canyang419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构预测是从氨基酸序列预测蛋白质的三维结构,它是生物信息学和理论化学中最重要的目标之一。在医学和生物技术领域中,蛋白质结构预测也是非常重要的,可用于新药物的设计研究和新颖的酶的设计等,降低实验成本并提高药物制备的有效性。蛋白质属性信息是蛋白质结构预测方法中至关重要的因素,如残基的疏水性和亲水性、静电相互作用、氢和共价键、范德华相互作用、键角强度、焓和熵,可通过这些属性信息将蛋白质结构表述成势(场)函数,从而作为蛋白质结构预测目标函数进行模拟和求解;另一个重要因素是高效的计算优化方法,通过对势(场)函数进行采样与优化,模拟蛋白质折叠路径并对蛋白质结构进行预测。本文主要研究采样蛋白质构象空间的搜索算法,设计了基于群智能计算方法的个体化预测模型和蛋白质结构预测方法。具体内容包括:(1)第二章中提出了三类主要的搜索算法:异构粒子群优化,非同构布谷鸟搜索算法和非同构萤火虫算法。异构粒子群优化算法中种群被划分成四个子种群并维持异构搜索策略,不仅有利于信息共享机制从每个子种群中收集有用的信息,也有利于增强粒子间的合作和潜力搜索能力。在非同构布谷鸟搜索算法中,个体学习彼此之间的差异信息进行搜索,并基于量子机制利用整个群体的平均信息以及全局最佳信息进行有效地搜索。这个算法的非同构更新规则使个体在局部和全局区域进行有效的搜索并搜索问题空间(例如蛋白质构象空间)的潜在可能解。在非同构萤火虫算法中,α的五个不同策略随着迭代数量、种群规模大小和优化问题的维数变化而变化,此算法中提出了一种非同构搜索方案,使得群体保持稳定的局部搜索和全局搜索之间的平衡;针对经典算法的恒定光吸收系数的两个主要缺点设计了基于距离的自适应参数方法,该方法动态控制萤火虫的光度来改变个体之间吸引力。同时,萤火虫之间的差异信息可以充分用于提高每个萤火虫的局部搜索能力,根据灰度关联分析设计了一个灰度系数作为另一个自适应控制参数。本文从理论上证明了这三类算法的收敛性,这些分析为个体化模型设计及蛋白质折叠路径和结构预测提供了理论基础。(2)第三章设计了基于群智能算法的个体化模糊系统和神经网络,并分别将这两个个体化模型(其是根据特定对象所建立的数学模型)在物系统和蛋白质折叠识别问题上进行了验证。在个体化模糊模型中,通过群智能算法搜索模型的最优结构和合适参数,并用模糊规则的形式表达出,动态模拟生物系统的特性。它有效地解决了系统生物学问题中动态行为数学表达,这些行为可以用透明的和可读的模糊规则来解释。基于神经网络的个体化模型在蛋白质折叠片的识别预测进行验证,其利用蛋白质氨基酸序列的进化和结构信息预测不同的蛋白质折叠类型,其中神经网络模型被编码到一个增强型异构粒子群优化器的粒子中,通过智能算法的迭代优化找到最优的模型,大大提高了蛋白质折叠识别预测的精度。(3)蛋白质折叠途径和结构预测的目的是利用计算方法从氨基酸序列中找出蛋白质是如何折叠的以及每个原子的空间位置。第四章介绍了群智能算法,个体化预测模型及分子动力学模拟方法在蛋白质折叠途径和结构预测中的研究成果。基于当前的蛋白质结构预测研究(例如TerItFix),本文设计出两套蛋白质折叠路径和结构预测系统,根据蛋白质折叠“顺序稳定”原则,迭代预测其折叠路径和结构。折叠过程中的二级结构和联系图信息作为预测纠正偏差用于限制下一轮迭代。折叠模拟系统可以快速且高精度地同时预测蛋白质折叠路径和结构。
其他文献
三角范畴的粘合起源于A.Grothendieck关于代数几何中层的一个6函子观察,其公理化的定义由A.A.Beilinson,J.Bernstein和P.Deligne引入.这个概念提供了将三角范畴分解为两个三角子范畴、又将两个三角子范畴粘合成一个三角范畴的构造方法.这个构造方法高效而神秘,它条件众多、蕴含大量信息、却又广泛存在.为了更好地研究三角范畴,B.Parshall和S.Konig将三角范
大量的宇宙学和天文学观测证据表明宇宙中存在暗物质。在众多的暗物质候选粒子当中,弱相互作用大质量粒子是最有希望的候选粒子,这种超标准模型粒子很好的预言了宇宙中暗物质的残余密度。它可以和普通粒子发生弱相互作用,并通过直接探测实验来探测相互作用留下的核反冲能量。PandaX是一个低本底暗物质探测实验,位于中国锦屏地下实验室,并且采用双相氙气投影室来寻找暗物质。本论文将介绍PandaX实验于2014年至2
学位
本文,我们研究与量子物理、量子信息相关的算子函数和算子不等式理论等相关问题.我们讨论多元正则算子函数的广义透视映射的相关性质,Lieb-Ruskai凸性定理,一类新的算子凸(凹)函数及其Frechet微分映射,Peierls-Bogolyubov不等式以及算子平均不等式.我们的主要内容如下:第1章,简述了相关课题的研究背景,包括:基本概念,基本的算子理论、量子摘不等式以及矩阵凸凹性定理的研究历史.
全光纤锁模激光器作为一种产生高性能飞秒脉冲的理想光源,具有效率高、成本低、稳定性好、体积小、易集成等优点,一直都是锁模激光器领域的研究热点,已经被成功应用于超快光谱学、激光操控的化学反应、生物医学成像、频率计量、光通信及材料加工等领域。经过几十年的飞速发展,锁模激光器性能得到了大幅度提升。如何获得更短的脉冲、更高的脉冲能量、更高的峰值功率依然是未来的研究重点。本文的主要工作围绕全光纤锁模激光器展开
随着能源需求的不断增加,恶劣海况下的深水油气资源开发已经成为目前能源开采利用的发展趋势。为满足深海开采的要求,众多新型深水海洋结构物,如立柱式平台(Spar platform,简称Spar),张力腿平台(Tension Leg Platform,简称TLP),浮式生产储卸装置(Floating Production Storage and Offloading,简称FPSO)等,随着油气资源开采深
首先,我们提出了一种基于广义多项式混沌(gPC)的随机伽辽金方法(SG)用于计算具有随机和奇异系数的双曲方程。由于解的奇异性,标准gPC-SG方法收敛速度会很慢甚至不收敛。通过利用中心型有限差分或有限体积方法的离散解在空间和时间上较为光滑的特性,我们先离散原方程,然后再使用gPC-SG近似离散的系统。间断处的界面条件使用[1,2]中的方法处理,这样整个方法具有很快的收敛速度,对于固定的网格大小和时
强各向异性对流扩散方程在多孔介质的输运、聚变等离子体中的热传导、大气和海洋的流动等有着重要的应用。本论文主要研究含有Neumann边界条件、含有闭合磁场、含有间断、扩散项消失的强各向异性扩散方程的一致收敛阶格式。在磁化等离子体中,磁力线周围的粒子受到磁场的约束,平行和垂直磁场方向的导热强度系数比值可以达到1012。当边界条件是周期边界条件或者Neumann边界条件时,强各向异性的扩散导致极限情形下
分布式系统广泛存在于现代工业的各个领域,包括石油化工、生产制造、交通运输、航空航天等,它具有系统结构灵活、计算负载低、易于安装维护、支持信息共享与远程通信等优点,在学术界与工业界受到了人们的青睐。分布式模型预测控制作为解决大规模复杂分布式系统优化控制问题的关键方法,可有效处理多变量、多约束优化控制问题,成为分布式控制系统领域研究的重点。在实际大规模复杂系统的生产过程中,受外部环境及生产条件的影响,
本文主要研究几类非局部的和经典的非线性Schr(?)dinger(NLS)型可积系统,求得这几类非线性方程的不同类型的解,包括孤子解、呼吸子解、怪波解和周期解,并研究了不同孤子解之间的相互作用及其随着时间t的演变性质。本文前两部分研究非局部NLS型系统。2013年,Ablowitz和Musslimani[Phys.Rev.Lett.110(2013),064105]给出了一个新的非线性可积方程iq
基本进程代数是进程重写系统中基础的顺序进程。相比有限状态系统,它引入了无限状态;相比于基本并行进程,它是顺序执行,控制能力较强;相比于下推自动机,它可以被理解为一种简单的单状态下推自动机。即使基本进程代数的定义和计算结构十分简洁,该模型也有着一定的表达能力和广泛的应用。从语法的角度看,该系统定义的语法对应的语言和下推自动机能接受的语言一致。从计算模型的角度看,该系统也能模拟很多比有限状态机复杂的顺