寄生基因编码蛋白质结构特点及数学分类模型的建立

来源 :厦门大学 | 被引量 : 1次 | 上传用户:yanlei3352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
寄生蠕虫能分泌出一系列蛋白质到体表或者宿主体内,这类蛋白质被称为分泌蛋白质(ES proteins),它们具有不同的生物功能,它们帮助蠕虫入侵宿主组织,抵抗宿主免疫系统,是蠕虫能成功完成寄生生活史的关键因素。对分泌蛋白质的研究是研究蠕虫寄生机制,并从中寻求疫苗及药物用以防治蠕虫危害的重要手段。如果可以建立一个可以筛选、预测寄生蛋白质的模型,用来分析未知功能的蛋白质是否具有寄生功能,可缩小研究范围、大大减少工作量,使研究目标物更加明确。本文通过对寄生蛋白质序列特征的分析,建立了寄生蛋白质分类模型,为今后建立寄生蛋白质筛选模型提供基础。 目前,有多个假说用以解释寄生蠕虫如何获得适应寄生生活的能力的分子机制,但是没有定论。越来越多的研究指出这类参与蠕虫寄生过程的分泌蛋白质是由已经在自由生活物种中存在表达的蛋白质获得新的功能进化而来的。如果表达分泌蛋白质的基因的迅速进化是蠕虫适应寄生生活所必需的,那么是否具有分泌功能的蛋白质都具有更快速进化的特征呢?针对这一问题我们以马来布鲁丝虫为模型进行了研究。我们利用BLASTP蛋白质序列比对工具及SignalP蛋白质N端分泌信号肽分析工具分析由马来布鲁丝虫(Brugia malayi)基因组计划得到的蛋白质其 N端分泌信号的分布情况;初步探讨了具有分泌功能的蛋白质在非寄生序列中是否也处于更高进化地位的问题。我们一共分析了552条蛋白质序列,其中18.8%(104/552)的序列具有 N端分泌信号肽或者分泌信号锚定位点。序列比对结果显示虽然有部分具有 N端分泌信号的蛋白质序列没有在其它物种中发现同源蛋白质,但是也有同样数量的具有N端分泌信号的蛋白质序列是高度保守的。并且多数自由生活线虫表达的与马来布鲁丝虫表达的具有分泌功能的蛋白质同样具有 N端信号肽或信号锚定位点,我们认为具有分泌功能的蛋白质并不一定具有更高的进化地位。 既然 N端分泌信号肽并不能在广泛的意义上代表生物分子的进化特征。我们将研究的重点放到寄生蛋白质全序列分析上。我们根据多序列比对的结果,选择那些在寄生序列中高度保守并且不同于不具有寄生功能的序列的特定氨基酸位点作为聚类分析的变量,并根据氨基酸极性特性用1~20的数值来代表20种基本氨基酸,采用不同的聚类分析算法,得到了准确率最高的分类模型:以所选择的寄生蛋白质特定保守氨基酸位点,并且给这些氨基酸定义数值为变量,并以皮尔逊相关系数为相似性测度,用组内联结法进行聚类计算的寄生蛋白质分类模型。我们分析了28种寄生蛋白质家族,利用我们对变量的定义,综合运用各种聚类方法,24种蛋白质家族能被成功聚类,将寄生蛋白质与非寄生蛋白质区别开来,成功率达到85.7%:而利用我们建立的模型,其中18种的蛋白质家族能被成功聚类,成功率达到了64.3%。
其他文献
自复位框架结构体系是一种新型结构形式。自复位框架结构中梁柱主要构件地震作用后保持弹性,耗能元件消耗地震能量,震后更换变形严重的耗能元件,结构就能继续使用。本文主要研究
深基坑工程是近年来的一个重要课题,而其中地下连续墙支护又是城市民建及市政中最为常用的一种支护形式。在传统的设计计算方法中,由于基坑工程的众多影响因素及不确定性,为了保
  目的:对老年消化道恶性肿瘤患者的营养状态进行评估,筛查其营养不良风险,并找出其最佳的检测方法.方法:对老年消化道恶性肿瘤患者的营养状态进行评估,筛查其营养不良风险,并找