论文部分内容阅读
本研究探讨了在水稻和稻瘟病菌全蛋白组中使用基于蛋白结构的计算方法来筛选可能参与两者相互作用过程的蛋白的可能性。研究总共使用了来自TIGRRice v5的66710条蛋白序列和来自Broad M.grisea v6的11054条蛋白序列。我们使用了多种基于计算的方法来分析这些蛋白序列。本研究不仅仅提供了水稻和稻瘟病菌中那些可能与稻瘟病致病机制相关的基因产物以及与之相关通路的信息,也提供了一种筛选植物——病原菌相互识别过程中可能起作用的基因产物的不依赖于已有知识的手段。本研究的目的是设计一套方法来筛选出那些可能参与这两个物种之间细胞表面识别的基因产物,并且这种筛选的方法不建立在对该两物种具有专业背景知识和对其入侵——抵抗过程有具体了解的基础之上。较好的方法是使用GeneOntology(GO)来对编码基因产物进行功能分类。对筛选出来的蛋白进行三维结构预测,并对其进行双盲蛋白对接测试。有一些通用的信号通路如cAMP和MAPK信号通路被证明参与了附着胞的形成。本研究对于筛选出来的可能参与该两物种间宿主——寄主识别的基因产物进行了文献方面的查阅,并发现与该领域内其它研究者的报道一致。这些研究中有些是对相关基因或片断的直接测序,有些是借助于基因芯片的方法,还有一些则是使用了酵母双杂交体系来研究这种相互作用。只有水稻蛋白组中的18个蛋白(共66710个)以及稻瘟病菌蛋白组中的24个蛋白(共11054个)最后通过了本研究所设计的严格流程——细胞内定位信息的筛选,蛋白三维建模,双盲蛋白对接测试,结果的人工验证。包括30对这些蛋白之间的相互作用。这些蛋白被认为参与了一些重要的细胞信号转导和代谢通路,并且这些信号转导和代谢通路与细胞的表面识别和细胞外被的降解有关。具体结果按照流程分步叙述如下:对蛋白编码基因产物的GO条目的分配水稻蛋白组中,总共有39587个基因产物至少被分配了一个GO条目,这些基因产物在双序列联配中的匹配长度超过100个氨基酸残基,并且匹配的P值小于0.05。这些编码基因产物占水稻蛋白组的59.34%。作为对照,在模式植物拟南芥中,这一比例达到了98.53%(27445)。在稻瘟病菌蛋白组中,有5545个基因产物被分配了至少一个GO条目,约占全蛋白组的49.21%。在玉米黑粉菌(也是一种主要的植物病原菌)中,这一比例上升到59.16%,有3874个蛋白被分配了至少一个GO条目。在得到更广泛关注的模式生物——酿酒酵母中,有5879个蛋白在GO数据库中存在对应的同源蛋白,几乎包含了该物种中已知的全部蛋白。水稻和稻瘟病菌中蛋白的细胞组分分析对筛选出来的39587个水稻及5545个稻瘟病菌的蛋白进行了GO瘦条目定位的分析。大概有3.82%(1151个,无冗余)的水稻蛋白的细胞定位被认为与质膜和胞外基质有关(GO:0005576,GO:0005578,GO:0005615,GO:0005618,GO:0005886,GO:0030312,GO:0030313)。在稻瘟病菌中,这个比例接近8.60%(477个)。这里我们使用了细胞组分而不是常用的分子功能来进行分析以筛选出符合要求的蛋白。这些蛋白可能在病原微生物和宿主之间发生的细胞表面接触和识别中起作用,并由此在这两个不同物种的细胞内启动相应的信号转导过程。本分析基于目标序列与GO数据库中已知功能的蛋白序列之间存在相似性。蛋白建模和双盲蛋白对接测试那些被认为可能存在于胞外基质或细胞膜或细胞骨架上的蛋白中只有相当少的部分最终通过了蛋白建模和双盲蛋白对接测试。为了描述的方便,这些蛋白被分成三组:位于胞外空间的酶,细胞膜上参与信号转导的上游组分,细胞骨架及胞外基质骨架的结构性组分。在结果中发现了一些已经被报道的酶。如在稻瘟病菌蛋白组中找到了XYL-6的一些亚型(MGG06593,MGG07955,MGG08401,MGG08424,MGG15430)。XYL-6是一种木聚糖酶(EC 3.2.1.8),它可以将木聚糖降解成木糖,从而破坏半纤维素。而半纤维素是植物细胞壁的主要成分之一。壳多糖的生物合成和降解是影响真菌的细胞形状和细胞形态发生的重要因素。壳多糖酶(EC 3.2.1.14)是参与真菌细胞壁中壳多糖重塑过程的一种重要的酶,而这种重塑对于菌丝的生长有相当重要的作用。最后通过本步骤测试的稻瘟病菌蛋白中,存在两个壳多糖酶,MGG03599和MGG10333。本步骤筛选出来的结果中有一些上游的细胞信号转导组分和一些位于细胞膜上的转运蛋白。Mg-NCS-1是钙调蛋白(CaM)家族中的一员,稻瘟病菌蛋白组中存在它的同源蛋白MGG01550,后者通过了严格的蛋白建模和蛋白对接测试。此外,MGG01550也被认为参与了cAMP信号通路。网格蛋白接头复合体(AP-1)的功能中最重要的是它参与了网格蛋白包被小泡的形成。这是最经典的将胞外分子从细胞表面运送到细胞内膜空间的胞吞作用途径。这种内化作用有组成性的,也有受细胞信号调节的。稻瘟病菌蛋白组中一个注释信息为“AP-1 complex subunit sigma-1”的蛋白,MGG11227,与Schizosaccharomyces pombe中已知功能的蛋白SPAP27G11.06c具有58%的氨基酸水平上的相似性,该匹配的e-value为3.67e-49。此外,在稻瘟病菌和水稻的蛋白组中均找到了一组微丝或微管蛋白细胞骨架组分及其相关蛋白(MGG03164,MGG06650,MGG06884,MGG11167,LOCOs02g14000,LOCOs03g63690,LOCOs10g43040)。在丝状真菌中,肌动蛋白细胞骨架对于菌丝中极性的建立和维持以及分裂时收缩环的形成都是必须的。通路查找只有水稻中的两个蛋白达到了ptools中内建的搜索阈值。在RiceCyc 2.0.1中,LOCOs07g10600编码的蛋白具有假定的cycloartenol-C-24-methyltransferase活力。该酶被认为催化了固醇生物合成、环丙烷和环丙稀脂肪酸生物合成、环丙烷脂肪酸(CFA)生物合成等三个代谢通路中的四个反应。另一个水稻位点LOCOs11g37890编码一个假定的GDP-甘露糖-3’,5’-异构酶(EC 1.1.1.145)。该酶被认为参与了brassinosteroid biosynthesisⅡ代谢通路。此外,在稻瘟病菌蛋白组中找到了两个Gallus gallus中钙调蛋白P62149的同源物(MGG06884,MGG11167)。为了了解在植物——病原菌最初识别过程中起关键作用的内在机制,我们使用了基于结构的方法来筛选可能在水稻和稻瘟病菌细胞表面识别过程中起作用的蛋白,然后对这些筛选出来的蛋白进行文献搜索以确定它们所在的代谢和细胞信号转导通路。这种基于结构的方法有一个显著的优点就是:目标蛋白的具体信息并不是必需的。在蛋白建模过程中,PROSPECTⅡ的模板库更新是一个主要的问题,这个问题也存在于其它许多非商业的结构预测软件中。无论把系统生物学作为一个研究领域还是仅仅作为一个样式,使用无注释的基因组/蛋白组序列信息预测通路(代谢或者信号通路)都是它的发展趋势。而缺少可信的实验数据和结构化的描述词汇则限制了通路搜索在当前大量数据自动化分析方面的应用。