论文部分内容阅读
摘要:YUC基因家族催化吲哚-3-丙酮酸(IPA)生成生长素(IAA)的过程,进而调控植物生长素的合成。目前,研究者已经在多种植物上鉴定分析了YUCCA基因家族,但是关于烟草中该基因的报道较少。为了探讨普通烟草YUCCA基因结构及功能,通过检索普通烟草全基因组蛋白序列,筛选出21个烟草YUCCA基因家族序列,利用生物信息学工具对其蛋白质结构域、亚细胞定位、同源性进行分析。系统发育树分析结果显示,烟草YUCCA蛋白可以聚类到4个分支,与同为单子叶植物的拟南芥的亲缘关系较近。结构域分析结果显示,烟草YUCCA基因内含子数量在0~6个之间;协同进化树分析结果显示,亲缘关系近的基因内含子数量较为相近;亚细胞定位结果显示,19个序列定位到细胞质,2个序列定位到细胞质膜,该基因可能参与细胞质基因的转录调控。
关键词:烟草;YUCCA基因家族;生物信息学;生长素
生长素(IAA)是一种重要的植物激素,参与植物的大部分生长发育过程,如在花、维管束、叶的发育和胚胎模式等发育过程中发挥了重要作用。近年来,IAA的合成途径已经被揭示(图1)[1],IAA生物合成的2条主要途径包括色氨酸(Trp)依赖途径和Trp独立途径[2]。通过色氨酸转氨酶(TAA)/YUCCA(YUC)途径合成生长素是目前研究最多的生长素生物合成途径,该途径中的Trp首先由TAA转化为吲哚-3-丙酮酸酯(IPA),IPA在YUC家族编码的黄素单加氧酶作用下产生IAA,此过程为多种植物IAA合成的限速步骤[3-5]。YUC是最早被确定为生长素合成过程的关键酶,因为 YUC酶在拟南芥中过表达导致IAA过量产生[3]。研究者在拟南芥[6-7]、水稻[8]、玉米[9]等植物中进行了YUCCA基因的全基因分析,而对烟草中该基因的研究较少。过表达OsYUCCA1基因的水稻植株表现出IAA水平升高和生长素分泌过多的特征表型,而表达反义OsYUCCA1 cDNA的植株则表现出生长素不敏感[8]。过表达拟南芥AtYUC6基因的马铃薯具有植株增高、生命周期延长等较明显的生长素表现特征[9]。YUC基因的失活导致在表达YUC基因的组织中生长素报告基因DR5-GUS的表达量显著降低[6]。本研究利用生物信息学方法对烟草YUCCA基因家族进行分析,为深入探讨烟草该基因家族的功能提供理论基础。
1 材料与方法
1.1 数据来源
从美国国家生物信息中心(NCBI)网站(https://www.ncbi.nlm.nih.gov/)下载拟南芥、水稻、玉米、小麦的YUCCA蛋白序列,合并作为种子序列。从SNG数据库(https://solgenomics.net/)下载普通烟草蛋白序列文件和gff文件。
1.2 烟草YUCCA基因的鉴定和理化性质分析
以拟南芥、水稻、小麦、玉米的YUCCA蛋白序列为种子序列,通过BLASTp检索烟草的全部蛋白质序列,E值设置为1×10-10。经去重复,共获得25个候选序列,将候选序列提交到Pfam数据库(https://web.expasy.org/protparam/)中,鉴定其是否含有YUCCA蛋白特有的保守结构域,E值设置为0.001。然后将获得的序列提交到ExPASy(https://web.expasy.org/protparam/),预测其分子量、氨基酸数量、等电点等信息。再将序列提交到Protcomp 9.0(http://linux1.softberry.com/),对其进行亚细胞定位分析。
1.3 YUCCA基因家族的保守域分析和同源性分析
搜索煙草YUCCA基因家族中的基序,可以揭示基因家族在进化中的多样性并推测它们的功能。通过MEME搜索烟草YUCCA蛋白质氨基酸序列,对其基序进行预测分析,预测基量设定为10。
通过基因进化树,可以清晰、直观地观察到基因家族成员在进化过程中的分化情况。为了研究烟草YUCCA基因在进化中的规律,用MEGA软件对拟南芥、水稻、玉米、烟草的YUCCA蛋白质序列进行多序列比对,选择泊松模型,bootstrap值设置为1 000,构建邻接进化树。
1.4 烟草YUCCA基因家族表达模式分析
从NCBI GEO数据库下载编号为GSE95717的普通烟草品种K326的转录组数据,将本研究获得的烟草 YUCCA基因家族成员依次检索,提取匹配到的烟草相关基因的表达数据,用Multiple Experiment Viewer软件对结果进行可视化分析。
2 结果与分析
2.1 YUCCA基因家族的鉴定和理化性质分析
利用种子序列检索普通烟草蛋白质数据库,得到25个YUCCA基因家族候选序列。将候选序列提交至Pfam数据库,其中有21个序列含有YUCCA基因家族特有的蛋白结构保守域,最终获得21个烟草YUCCA基因家族成员(表1、图2)。理化性质分析结果显示,最短的YUCCA蛋白序列(YUCCA17)包含161个氨基酸,最长的YUCCA蛋白序列(YUCCA21)包含485个氨基酸,相应的相对分子量分别为18 247.92、5 837.18;YUCCA20~YUCCA9的理论等电点为572~9.43,YUCCA9~YUCCA8的不稳定指数为29.44~48.79。在21个YUCCA蛋白序列中,YUCCA15没有内含子,YUCCA17含有1个内含子,YUCCA1~YUCCA8含有2个内含子,YUCCA9~YUCCA14、YUCCA16、YUCCA19含有3个内含子,YUCCA18含有4个内含子,YUCCA20、YUCCA21含有6个内含子。将序列提交到Protcomp 9.0进行亚细胞定位,发现除了YUCCA20、YUCCA21定位在细胞质膜,其余19条序列均定位在细胞质。染色体定位结果显示,10个基因定位到9条染色体上,其中17号染色体上有2个基因,7、8、12、16、19、21、22、23号染色体均有1个基因,其余11个家族成员定位到Scaffold上。 2.2 烟草YUCCA蛋白序列保守域分析
用DNAMAN工具对21个烟草的YUCCA蛋白序列进行比对,结果(图3)发现,除个别序列外,大部分序列含有黄素嘌呤二核苷酸(FAD)结合位点、腺嘌呤核苷三磷酸序列、还原型辅酶Ⅱ结合位点,这些位点在不同序列中几乎相同,其中在10个保守的motifs中,motif2为FAD、NADPH的结合位点。利用MEME工具对21条烟草的YUCCA蛋白序列进行分析(图4),发现在所有序列中,YUCCA20含有3个motifs,数量最少。协同系统进化树分析发现,分在同一分支基因的motif数量相近,分布在不同分支的基因各序列间的motif数量相差较大,可能在基因功能上也存在差异。
2.3 烟草、拟南芥、水稻、玉米YUCCA基因的同源性分析
为进一步研究YUCCA蛋白在植物中的进化规律,利用21个烟草YUCCA蛋白质序列、7个水稻YUCCA蛋白质序列、9个玉米YUCCA蛋白质序列、12个拟南芥YUCCA蛋白质序列构建系统发育树(图5)。进化树将这4种植物的49个YUCCA成员分为7个亚科(1~7),发现所有烟草YUCCA蛋白都属于1、5、6、7这4个分支。分支2、3属于水稻特有的2个类群,分支4是玉米特有的1个类群。在1、5、6、7分支中, 同为双子叶植物的烟草、拟南芥YUCCA蛋白的亲缘关系较为密切,在分支6、7上,发现单子叶植物水稻、玉米YUCCA蛋白有较密切的亲缘关系,这意味着双子叶植物和单子叶植物的YUCCA基因亲缘关系较远,同为双子叶植物或同为单子叶植物具有高度的进化保守性和密切的同源关系。
2.4 烟草YUCCA基因的表达模式分析
烟草YUCCA基因聚类分析和可视化处理结果(图6)显示,不同基因的表达量存在差异,在18 h内,YUCCA13、YUCCA21在各组织中均高表达,YUCCA15、YUCCA16、YUCCA18、YUCCA19基因的表达水平较低。部分基因仅在某个组织的发育时期高表达,YUCCA5、YUCCA9、YUCCA10基因仅在茎端组织高表达,YUCCA1、YUCCA4基因在根组织高表达。综上分析结果表明,烟草YUCCA基因家族在不同组织中的表达量存在差异,茎端的总体表达量高于茎、根,这与茎端是生长素的主要合成部位相吻合。
3 讨论
YUC作为植物IAA合成过程中的限速酶,其生物学功能在多种植物中得到了广泛挖掘,但是该基因在烟草中的信息较为缺乏[10-11]。因此,利用生物信息學鉴定烟草YUCCA基因,并对其理化性质、保守结构域及同源性进行分析,可为后续研究YUCCA在生长素合成过程中发挥的分子机制提供基础信息。
本研究利用普通烟草数据库,鉴定出21个YUCCA基因家族成员,多于拟南芥的12个,出现这种现象可能是由于普通烟草是异源四倍体植物,在进化过程中,由于全基因复制而使基因家族出现扩增。通过烟草YUCCA蛋白保守结构域和进化树协同分析发现,划分在同一分支的家族成员具有相近数量的motif,表现出烟草YUCCA蛋白结构上的保守性、功能上的相似性;分布在不同分支的家族成员的motif数量相差较大,motif存在差异可以赋予YUCCA基因不同的功能,从而表现出基因家族功能的多样性,此结果与大豆[12]、大白菜[13]、水稻[8]YUCCA基因的研究结果相吻合。以往研究发现,FAD、NADPH、ATG基序可能是YUCCA基因生物学功能的关键位点,其中FAD、NADPH的结合位点是YUCCA活动中心[14-15]。亚细胞定位结果表明,烟草YUCCA成员被定位到细胞质和细胞质膜,生长素合成是在细胞质中完成的,这些基因可能在细胞质中参与生长素合成过程。本研究利用生物信息初步分析了普通烟草的21个YUCCA基因,但是关于该基因在烟草生长素合成过程中的作用机制及相关功能还有待进一步研究。
4 结论
本研究鉴定出21个烟草YUCCA基因家族成员,氨基酸长度为161~485个之间,除YUCCA15没有内含子外,其余成员的内含子数为2~6个;19个YUCCA家族成员亚细胞定位在细胞质,2个定位在细胞质膜;染色体定位结果显示,10个基因定位到9条染色体上,17号染色体有2个基因,7、8、12、16、19、21、22、23号染色体均有1个基因,其余11个家族成员定位到Scaffold,染色体位置尚无法确定。结构域分析发现,烟草YUCCA蛋白含有FAD、NADPH结合位点。系统进化树分析将烟草YUCCA家族成员分到了4个分支,在同一分支中,烟草与拟南芥YUCCA家族成员的亲缘关系较近。
参考文献:
[1]Mashiguchi K,Tanaka K,Sakai T,et al. The main auxin biosynthesis pathway in Arabidopsis[J]. Proceedings of the National Academy of Sciences of the United States of America,2011,108(45):18512-18517.
[2]Zazimalova E,Napier R M. Points of regulation for auxin action[J]. Plant Cell Reports,2003,21(7):625-634.
[3]Zhao Y. A role for flavin Monooxygenase-like enzymes in auxin biosynthesis[J]. Science,2001,291(5502):306-309.
[4]Zhao Y. Auxin biosynthesis:a simple two-step pathway converts tryptophan to indole-3-acetic acid in plants[J]. Molecular Plant,2012,5(2):334-338. [5]Tivendale N D,Ross J J,Cohen J D. The shifting paradigms of auxin biosynthesis[J]. Trends in Plant Science,2014,19(1):44-51.
[6]Cheng Y. Auxin biosynthesis by the YUCCA flavin monooxygenases controls the formation of floral organs and vascular tissues in Arabidopsis[J]. Genes
关键词:烟草;YUCCA基因家族;生物信息学;生长素
生长素(IAA)是一种重要的植物激素,参与植物的大部分生长发育过程,如在花、维管束、叶的发育和胚胎模式等发育过程中发挥了重要作用。近年来,IAA的合成途径已经被揭示(图1)[1],IAA生物合成的2条主要途径包括色氨酸(Trp)依赖途径和Trp独立途径[2]。通过色氨酸转氨酶(TAA)/YUCCA(YUC)途径合成生长素是目前研究最多的生长素生物合成途径,该途径中的Trp首先由TAA转化为吲哚-3-丙酮酸酯(IPA),IPA在YUC家族编码的黄素单加氧酶作用下产生IAA,此过程为多种植物IAA合成的限速步骤[3-5]。YUC是最早被确定为生长素合成过程的关键酶,因为 YUC酶在拟南芥中过表达导致IAA过量产生[3]。研究者在拟南芥[6-7]、水稻[8]、玉米[9]等植物中进行了YUCCA基因的全基因分析,而对烟草中该基因的研究较少。过表达OsYUCCA1基因的水稻植株表现出IAA水平升高和生长素分泌过多的特征表型,而表达反义OsYUCCA1 cDNA的植株则表现出生长素不敏感[8]。过表达拟南芥AtYUC6基因的马铃薯具有植株增高、生命周期延长等较明显的生长素表现特征[9]。YUC基因的失活导致在表达YUC基因的组织中生长素报告基因DR5-GUS的表达量显著降低[6]。本研究利用生物信息学方法对烟草YUCCA基因家族进行分析,为深入探讨烟草该基因家族的功能提供理论基础。
1 材料与方法
1.1 数据来源
从美国国家生物信息中心(NCBI)网站(https://www.ncbi.nlm.nih.gov/)下载拟南芥、水稻、玉米、小麦的YUCCA蛋白序列,合并作为种子序列。从SNG数据库(https://solgenomics.net/)下载普通烟草蛋白序列文件和gff文件。
1.2 烟草YUCCA基因的鉴定和理化性质分析
以拟南芥、水稻、小麦、玉米的YUCCA蛋白序列为种子序列,通过BLASTp检索烟草的全部蛋白质序列,E值设置为1×10-10。经去重复,共获得25个候选序列,将候选序列提交到Pfam数据库(https://web.expasy.org/protparam/)中,鉴定其是否含有YUCCA蛋白特有的保守结构域,E值设置为0.001。然后将获得的序列提交到ExPASy(https://web.expasy.org/protparam/),预测其分子量、氨基酸数量、等电点等信息。再将序列提交到Protcomp 9.0(http://linux1.softberry.com/),对其进行亚细胞定位分析。
1.3 YUCCA基因家族的保守域分析和同源性分析
搜索煙草YUCCA基因家族中的基序,可以揭示基因家族在进化中的多样性并推测它们的功能。通过MEME搜索烟草YUCCA蛋白质氨基酸序列,对其基序进行预测分析,预测基量设定为10。
通过基因进化树,可以清晰、直观地观察到基因家族成员在进化过程中的分化情况。为了研究烟草YUCCA基因在进化中的规律,用MEGA软件对拟南芥、水稻、玉米、烟草的YUCCA蛋白质序列进行多序列比对,选择泊松模型,bootstrap值设置为1 000,构建邻接进化树。
1.4 烟草YUCCA基因家族表达模式分析
从NCBI GEO数据库下载编号为GSE95717的普通烟草品种K326的转录组数据,将本研究获得的烟草 YUCCA基因家族成员依次检索,提取匹配到的烟草相关基因的表达数据,用Multiple Experiment Viewer软件对结果进行可视化分析。
2 结果与分析
2.1 YUCCA基因家族的鉴定和理化性质分析
利用种子序列检索普通烟草蛋白质数据库,得到25个YUCCA基因家族候选序列。将候选序列提交至Pfam数据库,其中有21个序列含有YUCCA基因家族特有的蛋白结构保守域,最终获得21个烟草YUCCA基因家族成员(表1、图2)。理化性质分析结果显示,最短的YUCCA蛋白序列(YUCCA17)包含161个氨基酸,最长的YUCCA蛋白序列(YUCCA21)包含485个氨基酸,相应的相对分子量分别为18 247.92、5 837.18;YUCCA20~YUCCA9的理论等电点为572~9.43,YUCCA9~YUCCA8的不稳定指数为29.44~48.79。在21个YUCCA蛋白序列中,YUCCA15没有内含子,YUCCA17含有1个内含子,YUCCA1~YUCCA8含有2个内含子,YUCCA9~YUCCA14、YUCCA16、YUCCA19含有3个内含子,YUCCA18含有4个内含子,YUCCA20、YUCCA21含有6个内含子。将序列提交到Protcomp 9.0进行亚细胞定位,发现除了YUCCA20、YUCCA21定位在细胞质膜,其余19条序列均定位在细胞质。染色体定位结果显示,10个基因定位到9条染色体上,其中17号染色体上有2个基因,7、8、12、16、19、21、22、23号染色体均有1个基因,其余11个家族成员定位到Scaffold上。 2.2 烟草YUCCA蛋白序列保守域分析
用DNAMAN工具对21个烟草的YUCCA蛋白序列进行比对,结果(图3)发现,除个别序列外,大部分序列含有黄素嘌呤二核苷酸(FAD)结合位点、腺嘌呤核苷三磷酸序列、还原型辅酶Ⅱ结合位点,这些位点在不同序列中几乎相同,其中在10个保守的motifs中,motif2为FAD、NADPH的结合位点。利用MEME工具对21条烟草的YUCCA蛋白序列进行分析(图4),发现在所有序列中,YUCCA20含有3个motifs,数量最少。协同系统进化树分析发现,分在同一分支基因的motif数量相近,分布在不同分支的基因各序列间的motif数量相差较大,可能在基因功能上也存在差异。
2.3 烟草、拟南芥、水稻、玉米YUCCA基因的同源性分析
为进一步研究YUCCA蛋白在植物中的进化规律,利用21个烟草YUCCA蛋白质序列、7个水稻YUCCA蛋白质序列、9个玉米YUCCA蛋白质序列、12个拟南芥YUCCA蛋白质序列构建系统发育树(图5)。进化树将这4种植物的49个YUCCA成员分为7个亚科(1~7),发现所有烟草YUCCA蛋白都属于1、5、6、7这4个分支。分支2、3属于水稻特有的2个类群,分支4是玉米特有的1个类群。在1、5、6、7分支中, 同为双子叶植物的烟草、拟南芥YUCCA蛋白的亲缘关系较为密切,在分支6、7上,发现单子叶植物水稻、玉米YUCCA蛋白有较密切的亲缘关系,这意味着双子叶植物和单子叶植物的YUCCA基因亲缘关系较远,同为双子叶植物或同为单子叶植物具有高度的进化保守性和密切的同源关系。
2.4 烟草YUCCA基因的表达模式分析
烟草YUCCA基因聚类分析和可视化处理结果(图6)显示,不同基因的表达量存在差异,在18 h内,YUCCA13、YUCCA21在各组织中均高表达,YUCCA15、YUCCA16、YUCCA18、YUCCA19基因的表达水平较低。部分基因仅在某个组织的发育时期高表达,YUCCA5、YUCCA9、YUCCA10基因仅在茎端组织高表达,YUCCA1、YUCCA4基因在根组织高表达。综上分析结果表明,烟草YUCCA基因家族在不同组织中的表达量存在差异,茎端的总体表达量高于茎、根,这与茎端是生长素的主要合成部位相吻合。
3 讨论
YUC作为植物IAA合成过程中的限速酶,其生物学功能在多种植物中得到了广泛挖掘,但是该基因在烟草中的信息较为缺乏[10-11]。因此,利用生物信息學鉴定烟草YUCCA基因,并对其理化性质、保守结构域及同源性进行分析,可为后续研究YUCCA在生长素合成过程中发挥的分子机制提供基础信息。
本研究利用普通烟草数据库,鉴定出21个YUCCA基因家族成员,多于拟南芥的12个,出现这种现象可能是由于普通烟草是异源四倍体植物,在进化过程中,由于全基因复制而使基因家族出现扩增。通过烟草YUCCA蛋白保守结构域和进化树协同分析发现,划分在同一分支的家族成员具有相近数量的motif,表现出烟草YUCCA蛋白结构上的保守性、功能上的相似性;分布在不同分支的家族成员的motif数量相差较大,motif存在差异可以赋予YUCCA基因不同的功能,从而表现出基因家族功能的多样性,此结果与大豆[12]、大白菜[13]、水稻[8]YUCCA基因的研究结果相吻合。以往研究发现,FAD、NADPH、ATG基序可能是YUCCA基因生物学功能的关键位点,其中FAD、NADPH的结合位点是YUCCA活动中心[14-15]。亚细胞定位结果表明,烟草YUCCA成员被定位到细胞质和细胞质膜,生长素合成是在细胞质中完成的,这些基因可能在细胞质中参与生长素合成过程。本研究利用生物信息初步分析了普通烟草的21个YUCCA基因,但是关于该基因在烟草生长素合成过程中的作用机制及相关功能还有待进一步研究。
4 结论
本研究鉴定出21个烟草YUCCA基因家族成员,氨基酸长度为161~485个之间,除YUCCA15没有内含子外,其余成员的内含子数为2~6个;19个YUCCA家族成员亚细胞定位在细胞质,2个定位在细胞质膜;染色体定位结果显示,10个基因定位到9条染色体上,17号染色体有2个基因,7、8、12、16、19、21、22、23号染色体均有1个基因,其余11个家族成员定位到Scaffold,染色体位置尚无法确定。结构域分析发现,烟草YUCCA蛋白含有FAD、NADPH结合位点。系统进化树分析将烟草YUCCA家族成员分到了4个分支,在同一分支中,烟草与拟南芥YUCCA家族成员的亲缘关系较近。
参考文献:
[1]Mashiguchi K,Tanaka K,Sakai T,et al. The main auxin biosynthesis pathway in Arabidopsis[J]. Proceedings of the National Academy of Sciences of the United States of America,2011,108(45):18512-18517.
[2]Zazimalova E,Napier R M. Points of regulation for auxin action[J]. Plant Cell Reports,2003,21(7):625-634.
[3]Zhao Y. A role for flavin Monooxygenase-like enzymes in auxin biosynthesis[J]. Science,2001,291(5502):306-309.
[4]Zhao Y. Auxin biosynthesis:a simple two-step pathway converts tryptophan to indole-3-acetic acid in plants[J]. Molecular Plant,2012,5(2):334-338. [5]Tivendale N D,Ross J J,Cohen J D. The shifting paradigms of auxin biosynthesis[J]. Trends in Plant Science,2014,19(1):44-51.
[6]Cheng Y. Auxin biosynthesis by the YUCCA flavin monooxygenases controls the formation of floral organs and vascular tissues in Arabidopsis[J]. Genes