结构基因组数据库构建及蛋白质主链构象的计算分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:li_qinglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质最重要的两类生物大分子之一,是生物体几乎所有活动的承担者,如生化反应的催化酶,呼吸系统中的血红蛋白,免疫系统中的抗体等等。生物体几乎所有的活动都离不开蛋白质。要想在分子水平上解释生命现象离不开对蛋白质结构和功能的研究。多数天然蛋白质在生理条件下都会折叠成稳定的三维空间结构,蛋白质的生物学功能在很大程度上取决于其空间结构,蛋白质结构构象多样性导致了不同的生物学功能。所以蛋白质结构的研究是功能研究和蛋白质设计的基础,也因此越来越得到重视。蛋白质种类繁多,结构千差万别,同时蛋白质结构测定实验是非常费时费力,消耗资源也大,而且成功率有限。为了解决这个矛盾,一方面国际上开展了许多结构基因组计划,试图通过高通量测定蛋白质结构在基因组规模上全面理解蛋白质功能,同时加快结构测定实验的速度,降低单个结构测定的成本。另一方面研究人员一直试图发展计算机模拟的方法来进行蛋白质结构预测,虽然在这方面取得了很大的成绩,但要实现完全解决蛋白质结构预测的目标还需很多的努力。本论文的工作重点主要是两方面:一是对结构基因组学中靶蛋白筛选和数据管理系统构建的工作,二是对分子动力学中增强采样方法以及小肽中侧链效应和近邻效应的研究。论文共分为以下三个部分:第1章绪论中简介了蛋白质结构的基础,介绍了目前蛋白质结构测定的常用方法,包括实验测定(X射线晶体衍射法和核磁共振波谱法)和理论预测的方法。理论预测的方法可以分为基于知识的建模预测和基于物理模型的从头预测。基于知识的建模预测又可以按照与已知结构模板的序列相似性可以分为比较建模法、折叠识别法。与实验测定蛋白质结构相比,理论预测的方法具有快速、低成本、高通量的优点,可以作为实验测定的一个有效的补充。本章还简单介绍了结构基因组的内容、优缺点以及当前世界范围内开展这项计划的大致情况。结构基因组计划的主要内容就是大规模、高通量的进行基因组规模上的蛋白质结构测定,因此会产生大量的实验数据,合理的存贮、管理、共享、挖掘这些数据也成为一项艰巨的任务摆在实验人员面前。同时由于实验测定蛋白质结构费时费力,靶蛋白筛选成为提高实验成功率和所测定结构的生物学意义的一个必不可少的环节。绪论最后我们花比较多的篇幅介绍了分子动力学的发展背景和现状,分子动力学作为一种基于物理模型的模拟预测方法除了可以获得蛋白质的结构信息还可以获得很多实验上无法测定的细节信息。分子动力学的基本思路就是用数值方法求解原子运动的牛顿方程或薛定谔方程。但是实际进行模拟时,考虑到体系大小和目前计算机的运算能力,通常都是采用半经验的势能函数,这些势能函数在不同分子力场中虽有差异,但基本上都包含成键相互作用(键长伸缩、键角弯曲、二面角旋转和弯曲)和非键相互作用(静电相互作用、范德华相互作用)项。这种形式的势函数简化了动力学模拟的计算但同时也限制了其准确度。因此发展出很多改进方法,如加入氢键项、极化效应和二面角项修正等。与模拟准确性一样,模拟时间也是制约分子动力学发展的一个主要因素。由于传统的分子动力学模拟的采样符合玻尔兹曼分布,因此要满足各态历经假设需要很长的模拟时间;同时由于体系中快速运动的存在限制了积分步长的大小。延长模拟时间的研究也因此可以分为延长积分步长和加快体系采样。延长积分步长主要是通过消除体系中的快速运动来实现。加快体系采样一是可以采用溶剂模型来减少溶剂分子的计算时间;二是可以采用非玻尔兹曼分布采样来加快构象空间的搜索。增强采样的方法经过20余年的努力目前发展的方法主要包括:高温动力学、放大集合运动方法、构象流动法、加速分子动力学、伞形采样、Tsallis有效势能、温度(哈密顿量)副本交换方法等。第2章中介绍了为人类CD34(+)造血干细胞/祖细胞及血液系统疾病相关蛋白质的结构基因组学研究进行的前期靶蛋白筛选工作和构建的一套高效的靶蛋白筛选、标注和数据管理的系统。首先介绍了该系统的框架、系统需求和功能。这是一个基于网页交互的数据库系统。通过用户交互的方式、参加结构基因组的不同小组可以方便的添加、修改、共享实验数据和实验方案,同时可以获取生物信息学方法预测的多种信息。其次介绍靶蛋白的结构和功能标注。通过多种生物信息学方法,我们收集整合了蛋白的各种结构和功能标注信息。包括一般信息、物理特性、二级结构、保守区域和潜在功能等。最后介绍结构基因组靶蛋白筛选的过程。筛选过程考虑到实验的可行性和潜在的生物学意义,我们给出了一种筛选的流程,并对筛选得到的1823个靶蛋白按优先级进行了排序。第3章中介绍了我们独立发展的一种哈密顿副本交换算法和用这种算法进行的残基类型和近邻相互作用的研究。在这种算法中,以丙氨酸二肽主链二面角的自由能曲面经过不同强度变形的伞形势加在各个副本得所有主链二面角上。采用广义的加权直方图分析来计算构象的自由能面的方法利用了所有交换的副本采样,包括加上和未加上附加伞形势的副本,这极大的降低了构象自由能曲面计算的统计不确定性(标准差0.5~1KJ/mol)。我们使用这种基于哈密顿量的副本交换方法研究近邻残基类型和构象对主链中特定二面角的构象平衡的影响,研究的体系包含丙氨酸、苯丙氨酸和颉氨酸的长度为2~5的多肽,模拟中全部采用显式溶剂,研究的焦点是主链二面角分布受自身残基类型以及近邻残基类型和构象的影响。结果不仅反应自身残基类型效应主要为Phe和Val相对Ala更倾向β构象,而且证明了近邻效应与自身残基类型效应大小相当。我们发现N端近邻主要表现出构象效应,各种近邻残基类型的α构象相对于β构象使下游的Ala倾向于β构象。C端近邻正好相反,主要表现出类型效应,C端的Val可以显著的使上游的Ala的构象平衡偏向于PⅡ。结果数据显示了与蛋白质卷曲结构数据库的统计结果具有相当程度的一致性,证明了这种近邻残基的相互作用在小肽和蛋白质中具有普遍性。此外我们还报导了一些在数据库统计中没有反应出的残基类型和近邻效应。
其他文献
在深对流活动中,有一部分对流能穿透对流层顶,这类对流称为穿透性对流,它对上对流层/下平流层(upper troposphere and lower stratosphere,简称UTLS)区域的能量、水汽以及痕量气体的收支起重要的调节作用,而UTLS区域内的辐射平衡也是全球能量平衡的一个重要组成部分。随着卫星观测资料的广泛应用,人们对深对流活动有了一定认识,特别是首部星载测雨雷达的升空,深对流及穿
日冕物质抛射(CME)是大尺度的太阳活动现象,它引起地球空间环境的剧烈扰动,是空间灾害天气的主要源头。对CME的观测和理论研究,是太阳物理和日地空间物理领域十分重要的课题。尽管这些研究已经开展了几十年,但是由于观测技术的限制,到现在为止,人们连CME的起源都没有完全研究清楚。本文就CME的起源问题作了相应的研究,并提出了可能的CME触发机制。我们首先回顾了CME的观测特征以及研究现状,然后介绍了C
学位
近些年,电子自旋共振(ESR)开始被广泛应用于结构生物学的研究,在蛋白质结构解析、蛋白质构象变化等等一系列重要的结构生物学问题上取得了令人瞩目的成功。结构域是蛋白质的基本构建模块,也是有特定功能蛋白质中独立进化的结构单元。某些蛋白质的结构域有明确规定的职能和行为,是各种细胞生命过程中的基石。基因组分析表明,超过70%的真核生物蛋白为多结构域蛋白。多结构域蛋白的模块化特性为其提供了稳定性以及新的合作
降雨是对流层中最常见的气象要素之一,它不仅与人类的生活、生产息息相关,而且降雨体系在整个大气的能量传输中起着很重要的作用,它在相当程度上引起了全球热量和湿度的重新分布。因此很早就受到了人们的关注和研究。对它的了解将推动大气海洋耦合的研究,帮助我们理解潜热在大尺度环流中的作用,提高我们对暴雨系统的动力学及形态学等许多方面的理解。目前,机载、星载雷达被越来越广泛的用于降雨的观测,它们有许多相似之处,如
学位
本论文主要介绍了稀有气体和双原子分子(CO,NO)团簇的同步辐射真空紫外光电离实验和理论研究,还介绍了原子分子物理实验站稀有气体滤波器的安装和调试工作,以及乙苯的光电离实验和理论研究。第一章介绍了原子、分子和团簇的光谱学和动力学研究现状,比较详细地介绍了光电离和光离解研究中的基本概念,如绝热电离能、垂直电离能、光电离截面、超激发态、里德堡态,以及基本的离解机理。介绍了光与物质相互作用研究中常用的实
粒子物理标准模型能够很成功的描述很多物理实验结果。它成功的预测了粲夸克(c),底夸克(t),Z玻色子,W玻色子以及希格斯玻色子的发现。量子色动力学(QCD)能够描述标准模型中夸克和胶子之间的强相互作用。基于格点量子色动力学的计算,在高温和低重子密度条件下,会发生从强子物质到夸克解禁闭的夸克胶子等离子体(QGP)的相变。夸克胶子等离子体也被认为存在于宇宙早期的演化中。美国布鲁克海文国家实验室(BNL
本论文的内容主要包括两个方面,一个是NSRL(National SynchrotronRadiation Laboratory)光电子能谱光束线和实验站的建设,一个是对Cu/3C-SiC界面的研究。NSRL原有的光电子能谱光束线自建成以后,在同步辐射应用研究方面发挥了重要的作用,并取得了很多有意义的结果。但是由于种种原因,这条光束线存在很多问题,使光电子能谱实验站不能充分发挥同步辐射的优势,因此决
《芙蓉楼送辛渐》是部编本四年级语文下册第七单元的内容,本单元以人物品质为主题。本课是开展"空中课堂"期间准备的一节常规课,面向武汉经济技术开发区(汉南区)全体四年级学生。一、激趣导入,唤起学生情感体验1.(出示PPT)今天我们进入第七单元的学习,本单元以"人物品质"为主题,在阅读中我们要从人物的语言、动作等描写中感受人物的品质,在习作中,则要学习从多个方面写出人物的特点。
期刊
由于在超高密度磁存储技术、磁阻传感器、磁随机存储器等诸多方面有着广泛的应用前景,微米、纳米磁性单元阵列最近吸引了越来越多的兴趣。目前,磁性单元研究包括微米、亚微米以及纳米尺度的磁性单元的制作及其特殊的磁特性研究。这些微小的单元的磁特性与大块材料以及连续膜的磁性有着诸多的不同之处。各向异性、单元之间的相互作用以及不同状态的磁畴结构是其中的几个最重要的问题,它们对于磁滞回线、矫顽力、剩磁、饱和场都有影
量子计算研究的根本目标是建造基于量子力学原理,能在许多复杂计算问题上大大超越经典计算机性能的新型计算机。作为经典计算方式的继承,量子计算能有效处理一类计算问题,这些问题在经典计算科学中具有相当计算复杂度甚至无法完成,比如大数的质因数分解。量子计算机的实验实现需要对脆弱的量子体系进行初始化,相干控制和操作以及读。要建立一种能够满足各方面要求的量子计算机是非常困难的。相比较而言,核磁共振是当前技术上最