论文部分内容阅读
蛋白质是生物体中含量最多的大分子,也是实现有机生物功能的基本物质之一。自然界中的蛋白质种类繁多,功能多样,是复杂的系统。然而,蛋白质的复杂性不仅仅表现在蛋白质序列和结构的多样性,还表现在蛋白质家族(即,拥有同样蛋白质结构的序列群)的存在以及其折叠过程中蛋白质各结构位点作用的非均衡性。对蛋白质复杂性的研究表明,蛋白质体系虽然复杂,但其复杂的背后总蕴藏着规律。根据这些蕴藏的规律,我们可以将蛋白质的复杂性进行简化,去除掉蛋白质复杂信息中的冗余信息。这有利于我们对蛋白质的机理的深入了解。有关蛋白质复杂性及其简化,已有了很多相关工作,本文主要对蛋白质序列和结构位点的复杂性进行了研究,并通过这些研究对蛋白质复杂性的简化做了相关讨论。
本文的主要内容如下:
首先,对蛋白质家族中的序列复杂性进行了研究。研究中我们考虑了蛋白质序列长度对序列复杂性的影响。研究结果表明,在蛋白质家族中,蛋白质序列的复杂性随着序列长度的增加有着先增加后饱和的变化趋向。这暗示我们在蛋白质的简化研究中,序列长度的影响必须考虑。我们的统计结果表明,对于链长短的蛋白质,表征其复杂度所需要的氨基酸种类少,而对于链长长的蛋白质,表征其复杂度所需要的氨基酸种类多。就总体而言,十二种氨基酸足够表征所有蛋白质的复杂度。
其次,对蛋白质结构位点在蛋白质热力学稳定性和动力学可折叠性中的复杂作用进行了研究。我们使用了位点突变的分析方法。研究结果表明根据其在突变时对蛋白质热力学稳定性的影响,蛋白质结构位点可以分为H型,P型和N型三种。为了稳定蛋白质结构,H型位点倾向于接受疏水性强的氨基酸,P型位点倾向于接受亲水性强的氨基酸,而N型位点则对疏水,亲水氨基酸的倾向相同。然而这三类结构位点对蛋白质动力学折叠性的影响并不同其对蛋白质热力学稳定性的影响一致,而是同其相对于蛋白质折叠核的位置有关。
最后,对蛋白质结构中折叠核位点进行了研究和识别。研究中,我们将蛋白质的三维结构转换成二维的残基网络,网络中的节点即氨基酸,连接即氨基酸之间的非共价键作用。通过对此种残基网络的研究,我们发现,蛋白质折叠核位点对于蛋白质各结构位点间的全局关联性有着重要的作用。根据折叠核这个特性,我们提出了通过网络容错的分析方法从蛋白质天然结构中识别蛋白质折叠核。
本文的创新点是:
1)对蛋白质家族中序列的复杂性做了统计分析。分析表明蛋白质家族中序列的复杂性同序列长度相关。这样的结果提示蛋白质的简化研究也需要考虑序列链长的因素。我们的统计结果表明,以往研究中九种氨基酸可以表征蛋白质体系复杂度的结论是在未分辨蛋白质链长情况下对所有蛋白质所做的一个平均结果。实际上,短链长蛋白所需要的氨基酸种类不足九,而长链长蛋白所需要的氨基酸种类要多于九。就所有蛋白而言,十二种氨基酸才足够表达其复杂度。2)对蛋白质结构位点在蛋白质热力学稳定性和动力学可折叠性中的非均衡作用进行了研究。根据其在突变情况下对蛋白质稳定性的影响,将蛋白质结构位点简化为三类,即,H型,P型和N型。而这三类结构位点对蛋白质动力学折叠性的影响并不同其对蛋白质热力学稳定性的影响一致,而是同其相对于蛋白质折叠核的位置有关。3)对蛋白质结构中折叠核位点进行了研究和识别。研究中使用了蛋白质的网络分析方法,并引入了网络分析中容错的概念。研究结果表明蛋白质的折叠核位点对于蛋白质各结构位点间的全局关联性有着重要的作用,并可以通过网络中容错的分析方法从蛋白质天然结构中识别得到。这同传统折叠核位点从蛋白质折叠的转变态中识别相比,大大简化了折叠核的识别。
本文共分五章:
1.第一章中,我们对蛋白质的序列组成,结构特征,折叠特性以及复杂性等做了简单的介绍。
2.第二章中,我们对蛋白质家族中的序列复杂性随序列长度的变化做了分析。发现蛋白质家族中序列的复杂性依赖于序列的长度。这样的结果提示我们,在蛋白质的简化研究中,序列长度的因素必须考虑在内。
3.第三章中,通过蛋白质的三维格点模型,我们对蛋白质中各结构位点在蛋白质热力学稳定性和动力学折叠性中所起的作用做了研究。研究发现,根据其在突变情况下对蛋白质稳定性的影响,蛋白质结构位点可简化为三类,即,H型,P型和N型。而这三类结构位点对蛋白质动力学折叠性的影响同他们相对于蛋白质折叠核的位置有关。
4.第四章中,我们研究了蛋白质结构中折叠核位点的特性及其识别。在此,蛋白质的网络分析法被应用其中。研究结果表明蛋白质的折叠核位点对于蛋白质各结构位点间的全局关联性有着重要的作用,并可以通过网络中容错的分析方法从蛋白质天然结构中识别得到。
5.第五章中,我们对全文做了总结,并讨论了尚待研究的问题。