论文部分内容阅读
蛋白质结构域是蛋白结构、功能和进化的基本单位。有趣的是,尽管大多数结构域是结构化的,但研究者也发现部分结构域是无序的。所以,基于生物信息学方法,对基因组中编码的所有蛋白质(本论文中称为“全蛋白质组”)中存在的无序结构域进行统计,分析它们的功能和进化特征,并对同种结构域无序率变化的生物学意义进行探索,可丰富人们对蛋白质结构域功能和进化的规律性认识,具有重要科学意义。 本研究选择了人类和小鼠、斑马鱼、果蝇、酵母、大肠杆菌等代表性模式生物进行全蛋白质组范围内蛋白质结构域无序率(Domain Structural Disordered Ratio,以下简称为DSDR)的分布统计。结果发现,在所分析的6个物种各自的全蛋白质组中,3.8-22.5%的蛋白质结构域是高无序的。有意思的是,在不同的进化分支中,结构化的结构域和高无序的结构域所占的比例差异很明显。在低等物种中,例如大肠杆菌和酵母,含有更多的完全结构化结构域,而高等物种中则含有更多的高无序结构域。这提示,进化过程中,无序结构域的比率发生较大变化。基于结构域起源时间的分析发现:年轻的(各进化分支特异性的)结构域与古老结构域相比,高无序的结构域比例更高;特别是高等物种,如斑马鱼、小鼠和人类,约有一半的年轻结构域是高无序的。 那么,进化中不断增加的无序结构域与结构化的结构域相比,有何功能特征昵?从亚细胞定位和生物学过程来看,完全结构化的结构域所在蛋白质倾向于定位于膜上,主要参与转运、GPCR信号通路、氧化还原、新陈代谢(特别是脂质代谢和碳水化合物代谢)等生物学过程;而高无序的结构域所在蛋白质倾向于定位于具有包膜的细胞器(如:线粒体、细胞核),主要参与转录调控、细胞粘附、细胞成分组织、生殖发育和细胞通讯等较为复杂的生物学过程。这提示,进化过程中不断增加的复杂性功能需求,是无序结构域产生的进化生物学动因。 同种结构域在蛋白内和蛋白间可能重复出现。有意思的是,人们发现同种结构域在不同的位置其DSDR可能出现变异(有时呈现从结构化向高无序的变异)。本研究对影响DSDR变异的因素进行了分析,发现对DSDR变异影响最大的因素,是结构域本身及其邻近氨基酸的疏水性;序列相似性较高的重复结构域,其序列相似性与其DSDR变异度呈负相关;但序列相似度较低的重复结构域之间,其DSDR变异度大部分较小,即序列不保守而结构保守。序列相似度低,是为了防止同种结构域区域的聚集而导致蛋白质错误折叠;但是为了维持结构域功能一致性,所以结构保守。蛋白内重复结构域的变异度与蛋白间重复的结构域的变异度相比,无变异的比率更高,但随着物种越高等这种趋势越不明显。这提示高等物种蛋白内同种结构域的结构和功能更趋向多样化. 同种结构域无序率变异的大小,与其功能特征密切相关。有重复结构域的蛋白中,仅含DSDR无变异的结构域的蛋白质,倾向于执行胶原蛋白代谢,转运,信号传导等,定位于膜上,线粒体,胞外区等,而含DSDR变异大的结构域的蛋白质,倾向于氮化合物代谢,转录,调节转录,细胞粘附等,定位于细胞骨架,细胞核和无膜细胞器。这提示,含重复结构域的蛋白质的功能对其重复结构域的无序率的变异存在功能约束作用。即,定位于膜、线粒体等,执行转运、代谢等功能的结构域,如果其无序率发生较大变化,将导致其功能异常,而在进化过程中被淘汰;而定位于细胞核、细胞骨架等,执行转录、调节转录、细胞粘附等功能的结构域,其功能需要呈现多样性,以实现不断增加的复杂、多样的功能需求,其无序率的变异是促进其功能发生多样性的原因之一。