论文部分内容阅读
摘 要: 对Genbank数据库中的43条长度在546-906个氨基酸之间的HSP90蛋白序列,采用生物信息学手段对HSP90家族蛋白序列标识和保守基序进行了分析,并结合这些信息对这些蛋白进行了分子系统发育分析表明:藻类HSP90蛋白高度保守,家族内可以分为几个亚家族,亚家族内既有原核又有真核藻类HSP90蛋白序列。
关键词: 藻类热休克蛋白;HSP90;系统发育
【中图分类号】 Q51 【文献标识码】 A 【文章编号】 2236-1879(2017)12-0013-01
大多数热休克蛋白的研究是以微生物、动物材料为主,关于植物热休克蛋白反应的研究起步较晚,80年代初期才开始研究高等植物中的热休克蛋白[1]。HSP90蛋白存在于从低等的原核藻类到陆生高等的植物中,在高等植物中,有些HSP90在常温下即有较高的表达,有些需要热激诱导产生,此外,低温、光照和高盐胁迫亦能使其高表达[2]。因此,以HSP90蛋白作为贯穿原核藻类到真核藻类间的纽带,除了可以了解原核藻类与真核藻类HSP90家族间的进化关系,也能为进一步探索HSP90蛋白在藻类中的分子系统学的研究提供有价值的参考依据。
1 材料与方法
1.1 蛋白序列的获得:
数据资料来源于NCBI的蛋白质数据库。共检索到33种藻类的336条HSP90蛋白提交记录。对这些蛋白序列下载到本地后通过人工和软件筛选,去除重复记录和长度不足500bp的序列后,共得到43条长度在546-906个氨基酸之间的HSP90蛋白序列。
1.2 HSPs蛋白序列结构分析:
蛋白序列标识的绘制和分析在网站上完成;运用MEME程序分析基因家族的氨基酸保守基序,程序在设置上选择做大的基序数为50,不同的基序数为15,其它均采用默认的参数;利用TargetP和SignalP工具进行信号肽和导肽预测。
1.3 HSPs蛋白系统发育关系分析:
将得到的氨基酸序列, 用CLUSTAL_X软件进行比对, 并进行人工调整以避免缺刻(gap)对结果的影响. 系统发育关系的构建和距离计算使用MEGA3.1 软件包进行。
2 结果与讨论
2.1 蛋白序列标识的绘制和Motif分析:
TargetP进行导肽预测结果显示(表1),其中预测可靠性等级最高为一级(隐藻的HSP90可能性=0.947),但细胞内定位未显示;隐藻门的四个HSP90预测等级为3-4级,可能性平均在0.7左右,定位于线粒体中;定位于叶绿体的只有莱茵衣藻的HSP90(可能性=0.741),该导肽位于叶绿体的可能性较高。
对HSP90基因家族的氨基酸序列做保守基序的分析,最短的序列有546個氨基酸殘基,最长的序列有906个氨基酸残基。发现基序1-15在HSP90蛋白家族的大多数的蛋白序列中都有,并且基序6、8、2、7和10只是在保守的HATPase_C结构域内,其余基序都位于HSP90中。HSPs的高度保守性说明他们在生物生命活动中具有重要的作用(图1)。
2.2 利用SignalP和TargetP工具进行信号肽和导肽预测:
热休克蛋白HSP90的信号肽剪切位点位于第第22 和 第23位氨基酸之间,即: VSA-MC之间,可能为信号肽的各个参数值为:(max.C=0.380;max.Y=0.467;max.S=0.972),其成为信号肽的可能性非常高。通过查询该蛋白所在数据库信息发现,此蛋白序列恰好是一种内质网型蛋白,属于一种分泌型蛋白。
2.3 蛋白序列分子系统发育分析:
用邻接法构建了HSP90氨基酸序列的系统发育树,得到的无根树显示分为4个群,群1-4分别包括蛋白个数为:15,14, 5和9。用邻接法构建的有根树也支持这一结果。我们推测所分析的43个HSP90蛋白序列可初步分为2-4个亚家族,并且亚家族之间对应的编码基因可能为旁系同源基因,即HSP90基因的复制先于物种的分离。对HSP90蛋白的基因序列分析提示,其在由原核向真核细胞进化过程中发生过基因复制事件,出现了细胞质型和内质网型两种HSP90蛋白,这与无根树中的分为不同的群是相符合的,但目前对HSP90家族的亚家族划分还不明确,因此,今后在考虑用HSP90蛋白序列对不同藻类进行分子系统学研究时,应该注意旁系同源基因的干扰,随着公共数据库中藻类HSP90蛋白序列的增多和藻类HSP90蛋白各个亚家族划分的明晰,HSP90将会更加成熟地应用与藻类分子系统学的研究。
参考文献
[1] 陈亚琼,肖调江,周浙昆(2006).热激蛋白与生物环境适应及进化的关系.自然科学进展, 16(9):1066-1073.
[2] Isaacs JS, Xu W, Neckers L (2003). Heat shock protein 90 as a molecular target for cancer therapeutics. Cancer Cell. 3(3):213-217.
关键词: 藻类热休克蛋白;HSP90;系统发育
【中图分类号】 Q51 【文献标识码】 A 【文章编号】 2236-1879(2017)12-0013-01
大多数热休克蛋白的研究是以微生物、动物材料为主,关于植物热休克蛋白反应的研究起步较晚,80年代初期才开始研究高等植物中的热休克蛋白[1]。HSP90蛋白存在于从低等的原核藻类到陆生高等的植物中,在高等植物中,有些HSP90在常温下即有较高的表达,有些需要热激诱导产生,此外,低温、光照和高盐胁迫亦能使其高表达[2]。因此,以HSP90蛋白作为贯穿原核藻类到真核藻类间的纽带,除了可以了解原核藻类与真核藻类HSP90家族间的进化关系,也能为进一步探索HSP90蛋白在藻类中的分子系统学的研究提供有价值的参考依据。
1 材料与方法
1.1 蛋白序列的获得:
数据资料来源于NCBI的蛋白质数据库。共检索到33种藻类的336条HSP90蛋白提交记录。对这些蛋白序列下载到本地后通过人工和软件筛选,去除重复记录和长度不足500bp的序列后,共得到43条长度在546-906个氨基酸之间的HSP90蛋白序列。
1.2 HSPs蛋白序列结构分析:
蛋白序列标识的绘制和分析在网站上完成;运用MEME程序分析基因家族的氨基酸保守基序,程序在设置上选择做大的基序数为50,不同的基序数为15,其它均采用默认的参数;利用TargetP和SignalP工具进行信号肽和导肽预测。
1.3 HSPs蛋白系统发育关系分析:
将得到的氨基酸序列, 用CLUSTAL_X软件进行比对, 并进行人工调整以避免缺刻(gap)对结果的影响. 系统发育关系的构建和距离计算使用MEGA3.1 软件包进行。
2 结果与讨论
2.1 蛋白序列标识的绘制和Motif分析:
TargetP进行导肽预测结果显示(表1),其中预测可靠性等级最高为一级(隐藻的HSP90可能性=0.947),但细胞内定位未显示;隐藻门的四个HSP90预测等级为3-4级,可能性平均在0.7左右,定位于线粒体中;定位于叶绿体的只有莱茵衣藻的HSP90(可能性=0.741),该导肽位于叶绿体的可能性较高。
对HSP90基因家族的氨基酸序列做保守基序的分析,最短的序列有546個氨基酸殘基,最长的序列有906个氨基酸残基。发现基序1-15在HSP90蛋白家族的大多数的蛋白序列中都有,并且基序6、8、2、7和10只是在保守的HATPase_C结构域内,其余基序都位于HSP90中。HSPs的高度保守性说明他们在生物生命活动中具有重要的作用(图1)。
2.2 利用SignalP和TargetP工具进行信号肽和导肽预测:
热休克蛋白HSP90的信号肽剪切位点位于第第22 和 第23位氨基酸之间,即: VSA-MC之间,可能为信号肽的各个参数值为:(max.C=0.380;max.Y=0.467;max.S=0.972),其成为信号肽的可能性非常高。通过查询该蛋白所在数据库信息发现,此蛋白序列恰好是一种内质网型蛋白,属于一种分泌型蛋白。
2.3 蛋白序列分子系统发育分析:
用邻接法构建了HSP90氨基酸序列的系统发育树,得到的无根树显示分为4个群,群1-4分别包括蛋白个数为:15,14, 5和9。用邻接法构建的有根树也支持这一结果。我们推测所分析的43个HSP90蛋白序列可初步分为2-4个亚家族,并且亚家族之间对应的编码基因可能为旁系同源基因,即HSP90基因的复制先于物种的分离。对HSP90蛋白的基因序列分析提示,其在由原核向真核细胞进化过程中发生过基因复制事件,出现了细胞质型和内质网型两种HSP90蛋白,这与无根树中的分为不同的群是相符合的,但目前对HSP90家族的亚家族划分还不明确,因此,今后在考虑用HSP90蛋白序列对不同藻类进行分子系统学研究时,应该注意旁系同源基因的干扰,随着公共数据库中藻类HSP90蛋白序列的增多和藻类HSP90蛋白各个亚家族划分的明晰,HSP90将会更加成熟地应用与藻类分子系统学的研究。
参考文献
[1] 陈亚琼,肖调江,周浙昆(2006).热激蛋白与生物环境适应及进化的关系.自然科学进展, 16(9):1066-1073.
[2] Isaacs JS, Xu W, Neckers L (2003). Heat shock protein 90 as a molecular target for cancer therapeutics. Cancer Cell. 3(3):213-217.