基于群体进化的蛋白质结构从头预测构象优化方法研究

来源 :浙江工业大学 | 被引量 : 1次 | 上传用户:yingyingpps
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质广泛分布于生物体的各种组织当中,在生物的生命过程中扮演着不可或缺的角色。为更好的了解蛋白质在生物体内所执行的功能,进而揭示由于蛋白质结构改变导致的疾病发病机理,最终达到有针对性进行治疗的目的,获得蛋白质的三维空间结构是最直接、有效的途径。信息技术的发展及其与生物学科的交叉为蛋白质三维结构的获取提供了周期短、成本低的计算方法。直接从蛋白质的氨基酸序列出发,设计有效的算法,利用计算机获得蛋白质的三维空间结构,是生物信息学中的热点研究问题,本文研究内容主要针对蛋白质结构从头预测构象优化方法。预测得到的蛋白质三维结构、由序列比对提取的蛋白质同源结构距离谱信息、残基接触信息、二级结构信息等等,都能够反映由于氨基酸突变对蛋白质结构的影响,进而评估氨基酸突变对于蛋白质功能的影响,本文针对癌症驱动突变预测问题也进行了初步研究。本文在基于种群的进化算法框架下,基于抽象凸估计技术,提出了用于蛋白质结构预测的抽象凸下界估计信息引导的构象空间搜索方法;为了构建更紧的下界估计信息以进一步提高采样效率,提出了Lipschitz下界估计信息引导的构象特征空间采样方法;为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法;针对单氨基酸癌症驱动突变预测问题,提出了基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。本文的主要工作和成果如下:1.针对蛋白质结构从头预测中构象空间的搜索问题,在进化算法框架下提出了一种抽象凸下界估计信息引导的构象空间搜索方法。首先利用特征提取技术将高维构象空间转到特征空间以降低空间维数;其次,根据抽象凸理论建立下界估计空间,通过不断收紧的下界估计信息用来指导进化算法的搜索;此外,将片段组装和蒙特卡洛方法相结合以在构象空间中采样得到一系列亚稳态构象。测试结果表明了所提方法的有效性。2.为了进一步提高构象空间搜索效率,在基于种群的进化算法框架下,提出了一种用于蛋白质结构预测的插件式方法:Lipschitz下界估计信息引导的构象空间搜索方法。首先采用超速形状识别技术建立特征空间;然后,基于Lipschitz估计理论将特征空间转化为Lipschitz下界估计空间用于指导进化算法在构象空间中的采样;Lipschitz下界估计信息的使用减少了能量函数评价的次数,从而提高算法搜索效率。测试结果表明所提方法可以快速、有效地获得精度较高的近天然态蛋白质结构。3.蛋白质结构预测可以看作是一个多模态优化问题,为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法。在给定种群中,在基于超速形状识别技术的模态识别协议下,首先生成给定数量的模态;在种群进化过程中,基于种群拥挤度识别的差分进化算法用于模态保持;同时,基于抽象凸下界估计技术构造局部下降方向,进一步提高在低能量区域的采样能力。通过多模进化采样,可以得到若干个包含一系列与能量成比例的构象簇,在这些簇中可以直接提取诱饵构象。测试结果表明所提方法具有较强的采样能力,能够有效地获得近天然态构象。4.针对单氨基酸癌症驱动突变预测问题,提出了一种基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。首先,提取了从氨基酸到蛋白质三维结构的22种不同特征,作为随机森林分类器的输入信息;其次,采用搜集到的癌症相关单氨基酸突变数据集和无害单氨基酸突变数据集对分类器进行训练;然后,用独立测试集测试分类器的性能,并与其它方法进行比较;最后,案例分析表明了所提方法的有效性。
其他文献
“near field communication”,一种近场无线通信技术。可以在移动设备、消费类电子产品、PC和智能控件工具间提供轻松、安全、迅速、近距离、非接触式的识别,采取独特的信号衰
钻(冲)孔灌注桩在灌注施工及成桩后常见的事故有堵管、卡管、埋管、桩身蜂窝、夹泥、混浆、露筋甚至断桩,通过对常见事故的分析找出其产生的根本原因,在灌注施工巾针对产生事故环
帕金森病(Parkinson’s disease,PD)是黑质多巴胺神经元进行性丢失所致的神经系统变性疾病,发病率仅次于阿尔兹海默症。当多巴胺神经元损伤超过70%-80%,临床可见静止性震颤、
苝二酰亚胺(PDI)是经典的n-型有机半导体材料,它已被证明是有机太阳能电池中有潜力的受体材料。本论文设计了一系列以三蝶烯为核的三维(3D)PDI类小分子受体材料,并通过理论计
任何重大理论问题都源于重大现实问题,任何重大现实问题都蕴含重大理论问题。近年来信息技术带给人类社会的巨变,让信息时代成为了各学科研究的热点。然而这其中诸多研究成果
针对船舶机舱监测系统信号传输过程中干扰源较多、干扰强度较大等特点,提出一种基于CAN冗余总线的船舶监测报警系统。在此基础上,根据船舶机舱可多路径敷设电缆的特点,提出了异
根据江西乐乐鸣山煤矿B3煤层顶,底板产出的大量植物化石,采用统计学方法,着重分析了其植物群的组成及性质,进而结合前人资料在较大的范围内进行了同期古植物群的对比。研究结果与对
为研究高压共轨船用柴油机燃烧与排放特性,应用CFD软件fire对某型船用柴油机喷雾燃烧进行了三维数值模拟。计算得到了不同轨压和不同喷油提前角下的燃油液滴分布、当量比分布
针对复杂多变、强多途和起伏干扰的浅海水声信道,建立了基于BELLHOP射线模型的时变衰落水声信道模型。在此基础上通过系统仿真的方法,分析了卷积码、RS码和串行级联码3种纠错
中国商务部长陈德铭2月25日在瑞士苏黎世接受新华社记者专访时表示,中国贸易和投资促进团欧洲之行是不久前温家宝总理访欧“信心之旅”的重要后续行动,旨在落实成果和向相关国