论文部分内容阅读
在蛋白质-蛋白质相互作用水平上研究蛋白质对理解其功能与进化具有重要的意义。目前在蛋白质组水平上,利用高通量技术和生物信息学方法,进行蛋白质-蛋白质相互作用的研究主要有两个层次的工作:①大规模发现相互作用的蛋白质;②对于这些相互作用的蛋白质,在序列上确定其可能的相互作用位点。对于第一层次的工作,随着生物技术与计算技术的发展,获得的蛋白质-蛋白质相互作用数据的准确度和覆盖度都越来越高,这为展开第二个层次的研究提供了坚实的基础。
本文通过整合并筛选出高质量的芽殖酵母(Saccharomyces cerevisiae)蛋白质-蛋白质相互作用数据集(正数据集),以及通过我们自己设计的计算方法所得到的蛋白质不相互作用数据集(负数据集),然后利用统计方法进行比较分析,在正数据集中找出那些出现次数显著多的模体(motif)-模体、模体-结构域(domain)和结构域-结构域对。这些由模体和结构域所构成的三个水平的相互作用对称之为在三个水平上的蛋白质相互作用的绑定位点,最后我们得到1124对模体-模体、3856对模体-结构域和1335对结构域-结构域。在此基础上,建立了酵母蛋白质-蛋白质相互作用绑定位点数据库及其可视化检索系统--BindingR(http://cmb.bnu.edu.cn/BindingR/index.html)。该系统为用户提供多种检索和过滤方式,如:⑴按照蛋白质信息检索一个或多个蛋白质所对应的相互作用关系及其对应的作用位点;⑵对于作用位点,由于模体在同一蛋白序列上经常高频重复出现,我们目前提供了按照三类蛋白质二级结构(α螺旋、β折叠和其它)的过滤方式,以便滤掉不太可能的作用位点;⑶检索模体-模体、模体-结构域和结构域-结构域对是否相互作用;⑷检索一个模体或结构域可能包含有的相互作用的模体和结构域。另一方面,有文献报道在人类蛋白质中结构域的杂凑性可以反映结构域与其它结构域的相互作用能力;在酵母蛋白质中对于iPfam数据集和我们之前预测的结构域-结构域相互作用数据集中也都发现了这一相关性。我们知道,结构域-结构域是介导蛋白质相互作用的一种重要方式,本文以杂凑性结构域作为联系结构域共出现网络与蛋白质-蛋白质相互作用网络的枢纽,通过分析我们发现在蛋白质-蛋白质相互作用网络中的关键蛋白质富含杂凑性结构域;进一步分析发现这些结构域在蛋白质相互作用网络中主要参与“细胞生长与调亡”(Cell Growth and Death)和“折叠、定位和降解”(Folding,Sorting and Degradation)等生物学过程,而富含的生物化学功能则主要为激酶蛋白质的激活(protein kinase activity,GO:0004672)。这些证据都在一定的程度上表明杂凑性结构域对于细胞基本生命活动具有重要的作用。此外,通过对蛋白质.蛋白质相互作用网络拓扑结构的研究,发现当敲除这些包含杂凑性结构域蛋白质后,网络的特征距离显著增大,网络中两个蛋白质之间的通讯变长,网络的稳定性下降,这也表明了这类蛋白质对于维持蛋白互作网络的稳定性具有重要的作用。