论文部分内容阅读
摘 要: 植物LysM型类受体激酶(lysin motif receptor-like kinase,LYKs)是植物中发现的一类重要的RLK,在植物生长发育、抵御逆境胁迫等方面具有不可忽视的作用,是植物中基因功能的研究热点。为更好地了解小立碗藓中的LYK基因,该文利用生物信息学的方法对小立碗藓(Physcomitrella patens)LysM型类受体激酶基因家族成员进行鉴定及分析。通过分析小立碗藓LYK家族成员的基本物理信息、基因结构、染色体定位及系统发生关系,初步探討了其LYK基因结构、进化与功能间的联系。结果表明:(1)小立碗藓中共有21个LYK基因,其氨基酸序列大小在625~755 aa之间,分子量为69.54~82.02 kDa,等电点在5.98~7.78之间。(2)将小立碗藓所有LYK蛋白与3种典型模式植物(水稻、拟南芥和蒺藜苜蓿)的LYK蛋白共同构建系统进化树,所有LYK蛋白被分为4个亚组(LYK-I、LYK-Ⅱ、LYR-I和LYR-Ⅱ)。小立碗藓各亚组内成员的基因结构、保守域特征显示出较为相似的特征,由此推测其可能具有相同或相似的功能。(3)染色体定位发现21个LYK基因集中分布于4条染色体上并出现小型基因簇,这可能与基因功能相联系。该文分析了小立碗藓LysM型类受体蛋白激酶基因家族的基本信息,可为后续深入研究其LYK基因家族成员的生理生化功能奠定基础。
关键词: 小立碗藓, LysM型类受体激酶, 基因家族, 生物信息学, 基因结构, 染色体定位, 系统进化关系
中图分类号: Q786
文献标识码: A
文章编号: 1000-3142(2021)06-0979-10
收稿日期: 2020-06-05
基金项目: 国家自然科学基金(30860158, 31560508, 31260426) [Supported by the National Natural Science Foundation of China (30860158, 31560508, 31260426)]。
作者简介: 高梅(1995-),硕士研究生,主要从事植物分子生物学研究,(Email)1024621800@qq.com。
*通信作者: 姜山,博士,教授,主要从事植物病理学研究,(Email)kyosan200312@hotmail.com。
Bioinformatics analysis of lysin motif receptor-like
kinase gene family in Physcomitrella patens
GAO Mei1, XIN Jiankang1, JIANG Shan2*
( 1. School of Life Sciences, Guizhou Normal University, Guiyang 550001, China; 2. School of International Education, Guizhou Normal University, Guiyang 550001, China )
Abstract: Plant lysin motif receptor-like kinase (LYKs) are an important type of RLK found in plants. They have a non-negligible role in plant growth and development, resistance to adversity stress, etc. It is a gene function in plants research hotspots. In order to better understand the LYK gene in Physcomitrella patens, we identified and analyzed members of the LysM-type receptor kinase gene family of P. patens, using bioinformatics and preliminarily discussed the relationship between LYK gene structure, evolution and function by analyzing the basic physical information, gene structure, chromosomal location and phylogenetic relationship of the LYK family members. The results were as follows: (1) There were 21 LYK genes in the moss, the amino acid sequence size ranged from 625 to 755 aa, the molecular weight ranges from 69.54 to 82.02 kDa, and the isoelectric point ranged from 5.98 to 7.78. (2) A phylogenetic tree was constructed by combining all the LYK proteins of P. patens with the LYK proteins of three typical model plants (Oryza sativa, Arabidopsis thaliana, and Medicago truncatula). All LYK proteins were divided into four subgroups (LYK-I, LYK-Ⅱ, LYR-I and LYR-Ⅱ). The genetic structure and conserved domain characteristics of the members in each subgroup of P. patens showed relatively similar characteristics, and it was speculated that they might have the same or similar functions. (3) Chromosome mapping found that 21 LYK genes were concentrated on four chromosomes and there were small gene clusters, which may also be related to gene function. This article analyzed the basic information of the LysM receptor-like protein kinase gene family of P. patens, which can lay the foundation for the in-depth study of the physiological and biochemical functions of its LYK gene family members.
Key words: Physcomitrella patens, lysin motif receptor-like kinase, gene family, bioinformatics, gene structure, chromosome location, phylogenetic relationship
植物類受体蛋白激酶是植物中一类重要的蛋白激酶,这些蛋白激酶与动物中受体蛋白激酶的分子结构类似, 由于与其特异结合的胞外信号分子或配体尚未被鉴定,因此被称为类受体蛋白激酶(receptor-like protein kinase,RLK)。典型的RLK由胞外结构域、跨膜结构域和胞内激酶域三部分构成,其中,胞外结构域含特异性结构基元,能够特异性识别细胞信号分子(Lehti-Shiu et al., 2009;田丽梅,2016)。植物LysM型类受体激酶(lysin motif receptor-like kinase,LYKs)是植物中发现的一类重要的类受体蛋白激酶。LysM型类受体蛋白激酶(lysM receptor-like kinase,LYKs)的典型特征是其胞外结构域中含有1~3个LysM结构基元(Afzal et al., 2008)。
不同植物中LYKs家族成员数存在差异,拟南芥和水稻中分别含有5个和10个LysM-RLKs(Shiu et al., 2004;Zhang et al., 2007),同时不同植物中LYKs胞外含有的LysM结构基元数也有所不同。除古细菌外,大多数生物中LysM蛋白结构域长度约为40 aa。植物中LYKs家族成员根据其激酶结构域的不同,可以划分为两种主要类型:LYK(LysM-I)和LYR(LysM-Ⅱ),其中LYK亚家族又可分为LYK-I和LYK-Ⅱ;LYR亚家族分为LYR-I和LYR-Ⅱ(Limpens et al., 2003; Arrighi et al., 2006)。目前,大多数LysM-RLK能够感知病原菌分子或参与植物-微生物间的相互作用,包括建立防御反应或根内共生体(Radutoiu et al., 2003;Wan et al., 2008)。
植物LysM型类受体蛋白激酶在植物防御反应及与微生物共生过程中的重要作用已被证实,而小立碗藓中LysM-RLK家族基因功能很少有报道。小立碗藓(Physcomitrella patens)是非维管束植物中的模式植物,也是早期登陆陆生植物代表。小立碗藓基因组大小为511 Mb,共含27条染色体且全基因组测序已完成 (Rensing et al., 2002)。基于此,本文采用生物信息学手段,在基因组范围内鉴定小立碗藓LYKs基因家族成员,并对其进行蛋白序列分析、结构域预测、染色体定位及进化分析等,旨在为后续研究该基因家族成员的生理生化功能提供参考。
1 研究对象与研究方法
1.1 研究对象
本研究以模式植物小立碗藓为研究对象,小立碗藓基因组注释序列下载于Ensembl Plants数据库(http://plants.ensembl.org/index.html)(Kersey et al., 2018),拟南芥基因组注释序列从TAIR数据库(https://www.arabidopsis.org/)下载(Poole, 2007)。水稻基因组注释序列下载于国家水稻数据中心(http://www.ricedata.cn/gene/)(樊颖伦,2009),蒺藜苜蓿基因组注释序列从Phytozome v12.1数据库(https://phytozome.jgi.doe.gov/pz/portal.html)下载。
1.2 研究方法
1.2.1 小立碗藓LYK基因家族成员的鉴定 利用TAIR数据库中拟南芥LYK基因家族成员(共5个)蛋白序列作为参考序列集合,在小立碗藓基因组序列(http://asia.ensembl.org/index.html)中进行同源搜索,查找小立碗藓中LYK基因家族成员,并进一步利用NCBI Conserved Domain Search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 筛选,确保氨基酸序列同时存在N-末端LysM和C-末端Pkinase结构域,最终得到21条候选LYK基因,用TBtools软件对基因保守结构域可视化(Chen et al., 2018)。 1.2.2 小立碗藓LYK基因家族的蛋白特征分析及亚细胞定位预测 将鉴定得到的21条候选类受体蛋白激酶家族蛋白序列,利用ExPASy网站(http://expasy.org/)进行分子量、理论等电点的预测,并利用SMART网站(http://smart.embi-heidelberg.de/)对所有基因进行保守结构域位置预测(陈紫华,2019);利用CELLO在线网站(http://cello.life.nctu.edu.tw/)预测小立碗藓LYK基因家族的亚细胞定位,表中*表示可信度最高(宋希茜,2016)。
1.2.3 小立碗藓LYK蛋白的保守域结构分析 利用MEME网站(http://meme-suite.org/)基于相似度较高的基序,即motif,分析LYK基因家族成员蛋白序列保守特征,用TBtools软件进行可视化。
1.2.4 小立碗藓LYK基因家族成员基因结构分析和基因组定位分析 根据检索到的小立碗藓LYK基因家族成员的基因组信息,利用从EnsemblPlants数据库(http://plants.ensembl.org/index.html)下载的小立碗藓基因染色体定位文件(.gff3),获得小立碗藓LYK基因家族成员的外显子及内含子分布情况和它们在小立碗藓基因组染色体上的位置信息,之后利用TBtools软件绘制基因结构图和染色体定位图。
1.2.5 小立碗藓LYK基因家族的进化分析 对小立碗藓LYK基因家族成员构建系统进化树,利用进化树分析软件MEGA7.0中的Muscle對小立碗藓LYK蛋白序列进行多序列比对(Edgar,2004)。利用进化树分析软件MEGA7.0,执行参数Partial deletion,选用合适的氨基酸替代模型(LG+G+I),使用基于LG矩阵模型的最大似然法推断进化历史(Sagulenko et al., 2018)。执行参数Poission correction、partial deletion,校验参数bootstrap=1 000,构建系统进化树,对小立碗藓LYK基因进行初步的亚族分类。
对小立碗藓LYK基因家族成员与水稻、拟南芥和蒺藜苜蓿中的同源家族成员构建系统进化树,方法同上,对小立碗藓LYK基因进一步分类。
2 结果与分析
2.1 小立碗藓LYK基因家族成员基本信息
利用TAIR(https://www.arabidopsis.org/)数据库下载的拟南芥LYK(LysM-RLK)家族基因序列作为基因家族的参考序列(共5个),使用TBtools软件中的Blast Wrapper,调取小立碗藓中的可能的LYKs基因家族成员序列,得到160个候选基因,再利用NCBI BLASTp进行双向Blast,去重复得到50条候选LYK基因,最后利用NCBI Conserved Domain Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)基于保守结构域进一步筛选,最终得到21条候选LYK基因,TBtools软件可视化如图1。利用生物信息学方法,对小立碗藓LYK基因家族成员的蛋白长度、染色体位置、分子量、理论等电点等基本信息进行分析并编号,详见表1。
通过蛋白特征分析,小立碗藓LYK蛋白的分子量为69.54~82.02 kDa,变化较稳定,理论等电点最小为5.98,最大为7.78。这些LYK基因编码蛋白的氨基酸长度在625~755 aa范围波动。运用SMART网站鉴定和Pfam数据库(http://pfam.xfam.org)验证结果显示,21个LysM型类受体蛋白激酶同时具有PKc_like和LysM特征结构域,不同LYK所含LysM domain的数目存在差异。这一结果与拟南芥中已鉴定出的LYK蛋白特征相似(Shiu et al., 2004)。亚细胞定位显示,通过CELLO网站预测小立碗藓LYK基因家族成员全部位于质膜。
2.2 小立碗藓LYK基因结构与蛋白保守结构域分析
通过MEME网站分析小立碗藓LYK基因序列,得到10个保守性较高的motif(图1:B),并且motif间的排布具有一定规律:3′端排布顺序相同,均为motif 5-motif 4-motif 7-motif 1-motif 2-motif 3; 5′端排布顺序分为motif 9- motif 6-motif 10-motif 8和motif 8-motif 6-motif 9-motif 10两类。可见,小立碗藓LYK家族成员均具有motif 5-motif 4-motif 7-motif 1-motif 2-motif 3的相对稳定结构,且位于基因3′端,各成员的5′端会出现motif排列顺序的差异。MEME预测的小立碗藓LYK蛋白motif信息见表2。发现小立碗藓LYK蛋白的motif长度最小为29,最大为50,并且存在长度相同的motif。
通过SMART网站和Pfam网站分析小立碗藓LYK蛋白保守结构域,即通常所说的domain,结果如图2和图1:C所示。21个LYK蛋白均含有激酶结构域和LysM结构域,但所含LysM结构域的个数存在一定差异。利用进化树软件MEGA7.0构建小立碗藓LYK基因家族的系统发育树(图1:A),发现21个LYK家族成员从上至下分为3个分支。为更准确地分类,后文与已鉴定的3种模式植物的LYK成员一同构建系统进化树,以更好地了解物种与进化之间的联系。
分析21个小立碗藓LYK基因的外显子、内含子结构(图1:C),发现约62%的LYK基因含有1~3个内含子;其中有6个LYK基因均含有13个内含子,分别为PpLYK9、PpLYK10、PpLYK11、PpLYK12、PpLYK13、PpLYK15; PpLYK16含有14个内含子,为21个基因中内含子数量最多的基因,猜测其编码的蛋白生物学功能较为多样。LysM-RLKs家族中未发现不含内含子的成员,其中PpLYK14为仅有的不含非编码区的LYK基因。 将所有LysM-RLKs家族成员的保守结构域和红色菱形框表示小立碗藓LYK基因,蓝色框表示蒺藜苜蓿LYK基因,绿色三角形表示水稻LYK基因,棕色圆形表示拟南芥LYK基因。
The red diamond-shaped box represents the LYK genes of Physcomitrella patens, the blue box represents the LYK genes of Medicago truncatula , the green triangle represents the LYK genes of Oryza sativa, and the brown circle represents the LYK genes of Arabidopsis thaliana.
基因结构整合在一起(图1:C),可以发现两类特征结构域(LysM和PKc_like)均存在于基因编码区(即CDS),说明这两类结构域均对基因的功能起作用。由图1:C可知,PpLYK9至PpLYK13在外显子-内含子结构上与其他LYK家族成员存在显著差异。
2.3 小立碗藓LYK蛋白的系统发育分析
通过MEGA7.0对小立碗藓LYK基因家族成员的蛋白序列进行多序列比对后构建系统发育树(图1:A),结果显示,其LYK基因家族的系统发育树有3个非常明显的分支,3大分支中均发现了独立的进化分支,说明小立碗藓LYK基因家族成员在漫長的进化历史中产生了不同的进化方式,推测同一大分支延伸出的不同分支成员间功能可能有所差异。
为了进一步将小立碗藓LYK基因家族成员分类并研究其与其他植物LYK基因间的进化关系,分别选取10个水稻(单子叶模式植物)、5个拟南芥(双子叶模式植物)和23个蒺藜苜蓿(豆科模式植物)中已鉴定出的所有LysM-RLK基因的氨基酸序列,与小立碗藓LysM-RLK共同构建系统进化树,结果如图3所示。4种植物中的LYK蛋白存在于4个亚族(LYK-I、LYK-Ⅱ、LYR-I、LYR-Ⅱ)中,而小立碗藓LYK蛋白仅存在于2个亚家族:LYK-Ⅱ和LYR-I。LYK-Ⅱ亚族中有8个小立碗藓LYK家族成员(PpLYK9-PpLYK16),另外13个成员属于LYR-I亚族。LYK-Ⅱ亚族中的小立碗藓LYK家族成员有两个分支,同源性在90%以上;LYR-I亚族中的小立碗藓LYK家族成员也存在两个分支,同源性在90%以上,可能为直系同源基因。
2.4 小立碗藓LYK基因家族的染色体定位
通过Ensembl Plants数据库获得小立碗藓LYK染色体定位信息,将小立碗藓21个LYK基因定位在4条染色体上,结果如图4所示。小立碗藓第7条染色体上定位了9个基因,为定位LYK基因数目最多的一条染色体;第1条、第9条、第11条染色体上分别定位了3、5、4个基因,可见小立碗藓21个LYK基因在染色体分布上是相对集中的。从图4中可明显看到在4条染色体上均出现小型基因簇,根据基因簇的定义,基因簇成员在结构和功能上可能具有明显的相似性。其中,4条染色体上均出现位置接近的基因,如1号染色体上基因PpLYK6、PpLYK7和PpLYK8,9号染色体上的PpLYK17、PpLYK18、PpLYK19、PpLYK20 和PpLYK21等,可能为串联重复。
3 讨论与结论
本研究鉴定了小立碗藓基因组中的LysM-RLK基因,并对其进行生物信息学相关分析。本研究共鉴定出小立碗藓中21个LysM-RLK家族成员,它们在染色体上的分布相对集中,仅位于4条染色体上,且出现5组小型基因簇,推测可能为串联重复。每个LYK均含有1~3个LysM保守结构域和1个激酶结构域,MEME结果显示同一亚家族各成员具有相同或相似的domain,说明该亚家族成员可能在小立碗藓整个生命过程中执行相似的功能。
从LysM-RLK家族成员数量看,小立碗藓(21个)多于拟南芥(5个)和水稻(10个)中LYK基因个数,和蒺藜苜蓿(23个)同源家族的数量相差不大。研究发现该家族成员在高等植物中普遍存在较多成员,如苹果中有12个LysM-RLK,百脉根(Lotus japonicus)中有17个LysM-RLK(Lohmann et al., 2010;周喆等,2014)。小立碗藓是早期登陆的植物代表,其LysM-RLK家族成员数量多于拟南芥和水稻,推测该家族成员在小立碗藓中可能存在基因功能的冗余。随着不断进化,一些高等植物中LysM-RLK家族成员数量得到扩展,意味着该家族新功能的引入。
通过系统进化分析,将小立碗藓LysM-RLK基因分为2个亚组(LYK-Ⅱ和LYR-I),它们均与水稻、拟南芥和蒺藜苜蓿同源家族中的部分成员聚为一类,而高等植物中LysM-RLK家族分为4个亚组, 推测小立碗藓中LysM-RLK家族成员的功能相对单一。与进化分析表征相似,同一亚组内,LYK基因的外显子-内含子的排布特征较为接近,同时,此基因结构特征与水稻、拟南芥和蒺藜苜蓿的外显子-内含子分布特征较为相似(Shiu et al., 2004;Arrighi et al., 2006)。综上所述,同一亚组内基因家族成员具有相近的保守域特征、同源关系和基因结构特征,说明其可能具有相同或相似的功能。
LysM型类受体蛋白激酶基因在植物生长发育及逆境胁迫中发挥重要功能,已成为当今植物中基因功能研究的热点之一。LysM-RLK基因家族在高等植物中数量较多,功能也具有多样性,在小立碗藓中功能的研究不够深入,大部分LYK基因功能尚不明确。本研究在已有数据库资源的基础上,在小立碗藓中筛选得到21个LYK基因,并利用生物信息学方法,对其LYK基因家族成员进行蛋白特征、染色体定位、基因结构及进化关系等分析,将小立碗藓LYK基因家族进行初步分类,从基因层面显示了小立碗藓的特征,为之后研究LysM型类受体蛋白激酶功能提供了理论依据。 參考文献:
AFZAL AJ, WOOD AJ, LIGHTFOOT DA, 2008. Plant receptor-like serine threonine kinases: Roles in signaling and plant defense [J]. Mol Plant Microb Inter, 21(5): 507-517.
ARRIGHI JF, BARRE A, AMOR BB, et al., 2006. The medicago truncatula lysine motif-receptor-like kinase gene family includes NFP and new nodule-expressed genes [J]. Plant Physiol, 142(1): 265-279.
CHEN CJ, CHEN H, HE YH, et al., 2018. TBtools, a Toolkit for biologists integrating various biological data handling tools with a user-friendly interface [J]. Mol Plant. DOI: 10.1016/j.molp.2020.06.009.
CHEN ZH, 2019. Conservation and functional differentiation of E (z) homologous genes in plants [D]. Fuzhou: Fujian Agriculture and Forestry University. [陈紫华, 2019. 植物中E(z)同源基因的保守性和功能分化研究 [D]. 福州: 福建农林大学.]
KERSEY PJ, ALLEN JE, ALLOT A, et al., 2018. Ensembl genomes 2018: An integrated omics infrastructure for non-vertebrate species [J]. Nucl Acid Res, 46(D1): D802-D808.
EDGAR RC, 2004. MUSCLE: Multiple sequence alignment withhigh accuracy and high throughput [J]. Nucl Acid Res, (5): 5.
FAN YL, 2009. Simple repeated sequence analysis of the genome of Xanthomonas oryzae PV. oryzae [J]. Anhui Agric Sci, 273 (20): 9387-9390. [樊颖伦, 2009. 水稻白叶枯病菌基因组简单重复序列分析 [J]. 安徽农业科学, 273(20): 9387-9390.]
ARRIGHI JF, ANNICK B, BEN AB, et al., 2006. The Medicago truncatula Lysine Motif-Receptor-Like Kinase Gene Family Includes NFP and New Nodule-Expressed Genes [J]. Plant Physiol, 142(1): 265-279.
LEHTI-SHIU MD, ZOU C, HANADA K, et al., 2009. Evolutionary history and stress regulation of plant receptor-like kinase/pelle genes [J]. Plant Physiol, 150(1): 12-26.
LIMPENS E, FRANKEN C, SMIT P, et al., 2003. LysM domain receptor kinases regulating rhizobial nod factor-induced infection [J]. Science, 302(5645): 630-633.
LOHMANN GV, SHIMODA Y, NIELSEN MW, et al., 2010. Evolution and regulation of the Lotus japonicus LysM receptor gene family [J]. Mol Plant Microb Inter, 23(4):510-521.
POOLE RL, 2007. The TAIR database [J]. Methods Mol Biol, 406(406): 179-212.
RADUTOIU S, MADSEN LH, MADSEN EB, et al., 2003. Plant recognition of symbiotic bacteria requires two LysM receptor-like kinases [J]. Nature, 425(6958): 585-592.
RENSING SA, ROMBAUTS S, PEER YVD, et al., 2002. Moss transcriptome and beyond[J]. Trend Plant Sci, 7(12):535-538.
STONE J, 1995. Plant protein kinase families and signal transduction [J]. Plant Physiol, 108(2): 451-457. SHIU S, KARLOWSKI WM, PAN R, et al., 2004. Comparative analysis of the receptpes-like kinase family in Arabidopsis and rice [J]. Plant Cell, 16: 1220-1234.
SONG XQ, 2016. Cloning and functional analysis of the super-accumulating SaCAD gene of Jingtiandongtian [D]. Beijing: Chinese Academy of Forestry. [宋希茜, 2016. 超积累型东南景天SaCAD基因的克隆及其功能分析 [D]. 北京: 中国林业科学研究院.]
SAGULENKO P, PULLER V, NEHER RA, 2018. TreeTime: Maximum-likelihood phylodynamic analysis [J]. Virus Evol, 4(1): 1.
SHIU SH, KARLOWSKI WM, PAN R, et al., 2004. Comparative analysis of the receptor-like kinase family in Arabidopsis and rice [J]. Plant Cell, 16(5): 1220-1234.
TIAN LM, 2016. Identification, expression pattern analysis and functional study of tomato IMPα/β and LYK family genes [D]. Hangzhou: Zhejiang University. [田丽梅, 2016. 番茄IMPα/β和LYK家族基因的鉴定、表达模式分析和功能研究 [D]. 杭州: 浙江大学.]
WAN J , ZHANG XC , NEECE D, et al., 2008. A LysM receptor-like kinase plays a critical role in chitin signaling and fungal resistance in Arabidopsis [J]. Plant Cell Online, 20(2): 471-481.
WANG L, LI G, WANG JH, et al., 2009. Molecular cloning and evolutionary analysis of the GJA1 (connexin43) gene from bats (Chiroptera) [J]. Genet Res, 91(2): 101-109.
ZHANG XC, WU XL, FINDLEY S, et al., 2007. Molecular evolution of Lysin motif-type receptor-like kinase in plants [J]. Plant Physiol, 144(2): 623-636.
ZHOU Z, ZHANG CX, ZHANG LY, et al., 2014. Bioinformatics and expression analysis of the LysM gene family in apple [J]. Chin J Agric Sci, 41(13): 2602-2612. [周喆, 張彩霞, 张利义, 等,2014. 苹果LysM基因家族的生物信息学及表达分析 [J]. 中国农业科学, 47(13): 2602-2612.]
(责任编辑 何永艳)
关键词: 小立碗藓, LysM型类受体激酶, 基因家族, 生物信息学, 基因结构, 染色体定位, 系统进化关系
中图分类号: Q786
文献标识码: A
文章编号: 1000-3142(2021)06-0979-10
收稿日期: 2020-06-05
基金项目: 国家自然科学基金(30860158, 31560508, 31260426) [Supported by the National Natural Science Foundation of China (30860158, 31560508, 31260426)]。
作者简介: 高梅(1995-),硕士研究生,主要从事植物分子生物学研究,(Email)1024621800@qq.com。
*通信作者: 姜山,博士,教授,主要从事植物病理学研究,(Email)kyosan200312@hotmail.com。
Bioinformatics analysis of lysin motif receptor-like
kinase gene family in Physcomitrella patens
GAO Mei1, XIN Jiankang1, JIANG Shan2*
( 1. School of Life Sciences, Guizhou Normal University, Guiyang 550001, China; 2. School of International Education, Guizhou Normal University, Guiyang 550001, China )
Abstract: Plant lysin motif receptor-like kinase (LYKs) are an important type of RLK found in plants. They have a non-negligible role in plant growth and development, resistance to adversity stress, etc. It is a gene function in plants research hotspots. In order to better understand the LYK gene in Physcomitrella patens, we identified and analyzed members of the LysM-type receptor kinase gene family of P. patens, using bioinformatics and preliminarily discussed the relationship between LYK gene structure, evolution and function by analyzing the basic physical information, gene structure, chromosomal location and phylogenetic relationship of the LYK family members. The results were as follows: (1) There were 21 LYK genes in the moss, the amino acid sequence size ranged from 625 to 755 aa, the molecular weight ranges from 69.54 to 82.02 kDa, and the isoelectric point ranged from 5.98 to 7.78. (2) A phylogenetic tree was constructed by combining all the LYK proteins of P. patens with the LYK proteins of three typical model plants (Oryza sativa, Arabidopsis thaliana, and Medicago truncatula). All LYK proteins were divided into four subgroups (LYK-I, LYK-Ⅱ, LYR-I and LYR-Ⅱ). The genetic structure and conserved domain characteristics of the members in each subgroup of P. patens showed relatively similar characteristics, and it was speculated that they might have the same or similar functions. (3) Chromosome mapping found that 21 LYK genes were concentrated on four chromosomes and there were small gene clusters, which may also be related to gene function. This article analyzed the basic information of the LysM receptor-like protein kinase gene family of P. patens, which can lay the foundation for the in-depth study of the physiological and biochemical functions of its LYK gene family members.
Key words: Physcomitrella patens, lysin motif receptor-like kinase, gene family, bioinformatics, gene structure, chromosome location, phylogenetic relationship
植物類受体蛋白激酶是植物中一类重要的蛋白激酶,这些蛋白激酶与动物中受体蛋白激酶的分子结构类似, 由于与其特异结合的胞外信号分子或配体尚未被鉴定,因此被称为类受体蛋白激酶(receptor-like protein kinase,RLK)。典型的RLK由胞外结构域、跨膜结构域和胞内激酶域三部分构成,其中,胞外结构域含特异性结构基元,能够特异性识别细胞信号分子(Lehti-Shiu et al., 2009;田丽梅,2016)。植物LysM型类受体激酶(lysin motif receptor-like kinase,LYKs)是植物中发现的一类重要的类受体蛋白激酶。LysM型类受体蛋白激酶(lysM receptor-like kinase,LYKs)的典型特征是其胞外结构域中含有1~3个LysM结构基元(Afzal et al., 2008)。
不同植物中LYKs家族成员数存在差异,拟南芥和水稻中分别含有5个和10个LysM-RLKs(Shiu et al., 2004;Zhang et al., 2007),同时不同植物中LYKs胞外含有的LysM结构基元数也有所不同。除古细菌外,大多数生物中LysM蛋白结构域长度约为40 aa。植物中LYKs家族成员根据其激酶结构域的不同,可以划分为两种主要类型:LYK(LysM-I)和LYR(LysM-Ⅱ),其中LYK亚家族又可分为LYK-I和LYK-Ⅱ;LYR亚家族分为LYR-I和LYR-Ⅱ(Limpens et al., 2003; Arrighi et al., 2006)。目前,大多数LysM-RLK能够感知病原菌分子或参与植物-微生物间的相互作用,包括建立防御反应或根内共生体(Radutoiu et al., 2003;Wan et al., 2008)。
植物LysM型类受体蛋白激酶在植物防御反应及与微生物共生过程中的重要作用已被证实,而小立碗藓中LysM-RLK家族基因功能很少有报道。小立碗藓(Physcomitrella patens)是非维管束植物中的模式植物,也是早期登陆陆生植物代表。小立碗藓基因组大小为511 Mb,共含27条染色体且全基因组测序已完成 (Rensing et al., 2002)。基于此,本文采用生物信息学手段,在基因组范围内鉴定小立碗藓LYKs基因家族成员,并对其进行蛋白序列分析、结构域预测、染色体定位及进化分析等,旨在为后续研究该基因家族成员的生理生化功能提供参考。
1 研究对象与研究方法
1.1 研究对象
本研究以模式植物小立碗藓为研究对象,小立碗藓基因组注释序列下载于Ensembl Plants数据库(http://plants.ensembl.org/index.html)(Kersey et al., 2018),拟南芥基因组注释序列从TAIR数据库(https://www.arabidopsis.org/)下载(Poole, 2007)。水稻基因组注释序列下载于国家水稻数据中心(http://www.ricedata.cn/gene/)(樊颖伦,2009),蒺藜苜蓿基因组注释序列从Phytozome v12.1数据库(https://phytozome.jgi.doe.gov/pz/portal.html)下载。
1.2 研究方法
1.2.1 小立碗藓LYK基因家族成员的鉴定 利用TAIR数据库中拟南芥LYK基因家族成员(共5个)蛋白序列作为参考序列集合,在小立碗藓基因组序列(http://asia.ensembl.org/index.html)中进行同源搜索,查找小立碗藓中LYK基因家族成员,并进一步利用NCBI Conserved Domain Search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 筛选,确保氨基酸序列同时存在N-末端LysM和C-末端Pkinase结构域,最终得到21条候选LYK基因,用TBtools软件对基因保守结构域可视化(Chen et al., 2018)。 1.2.2 小立碗藓LYK基因家族的蛋白特征分析及亚细胞定位预测 将鉴定得到的21条候选类受体蛋白激酶家族蛋白序列,利用ExPASy网站(http://expasy.org/)进行分子量、理论等电点的预测,并利用SMART网站(http://smart.embi-heidelberg.de/)对所有基因进行保守结构域位置预测(陈紫华,2019);利用CELLO在线网站(http://cello.life.nctu.edu.tw/)预测小立碗藓LYK基因家族的亚细胞定位,表中*表示可信度最高(宋希茜,2016)。
1.2.3 小立碗藓LYK蛋白的保守域结构分析 利用MEME网站(http://meme-suite.org/)基于相似度较高的基序,即motif,分析LYK基因家族成员蛋白序列保守特征,用TBtools软件进行可视化。
1.2.4 小立碗藓LYK基因家族成员基因结构分析和基因组定位分析 根据检索到的小立碗藓LYK基因家族成员的基因组信息,利用从EnsemblPlants数据库(http://plants.ensembl.org/index.html)下载的小立碗藓基因染色体定位文件(.gff3),获得小立碗藓LYK基因家族成员的外显子及内含子分布情况和它们在小立碗藓基因组染色体上的位置信息,之后利用TBtools软件绘制基因结构图和染色体定位图。
1.2.5 小立碗藓LYK基因家族的进化分析 对小立碗藓LYK基因家族成员构建系统进化树,利用进化树分析软件MEGA7.0中的Muscle對小立碗藓LYK蛋白序列进行多序列比对(Edgar,2004)。利用进化树分析软件MEGA7.0,执行参数Partial deletion,选用合适的氨基酸替代模型(LG+G+I),使用基于LG矩阵模型的最大似然法推断进化历史(Sagulenko et al., 2018)。执行参数Poission correction、partial deletion,校验参数bootstrap=1 000,构建系统进化树,对小立碗藓LYK基因进行初步的亚族分类。
对小立碗藓LYK基因家族成员与水稻、拟南芥和蒺藜苜蓿中的同源家族成员构建系统进化树,方法同上,对小立碗藓LYK基因进一步分类。
2 结果与分析
2.1 小立碗藓LYK基因家族成员基本信息
利用TAIR(https://www.arabidopsis.org/)数据库下载的拟南芥LYK(LysM-RLK)家族基因序列作为基因家族的参考序列(共5个),使用TBtools软件中的Blast Wrapper,调取小立碗藓中的可能的LYKs基因家族成员序列,得到160个候选基因,再利用NCBI BLASTp进行双向Blast,去重复得到50条候选LYK基因,最后利用NCBI Conserved Domain Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)基于保守结构域进一步筛选,最终得到21条候选LYK基因,TBtools软件可视化如图1。利用生物信息学方法,对小立碗藓LYK基因家族成员的蛋白长度、染色体位置、分子量、理论等电点等基本信息进行分析并编号,详见表1。
通过蛋白特征分析,小立碗藓LYK蛋白的分子量为69.54~82.02 kDa,变化较稳定,理论等电点最小为5.98,最大为7.78。这些LYK基因编码蛋白的氨基酸长度在625~755 aa范围波动。运用SMART网站鉴定和Pfam数据库(http://pfam.xfam.org)验证结果显示,21个LysM型类受体蛋白激酶同时具有PKc_like和LysM特征结构域,不同LYK所含LysM domain的数目存在差异。这一结果与拟南芥中已鉴定出的LYK蛋白特征相似(Shiu et al., 2004)。亚细胞定位显示,通过CELLO网站预测小立碗藓LYK基因家族成员全部位于质膜。
2.2 小立碗藓LYK基因结构与蛋白保守结构域分析
通过MEME网站分析小立碗藓LYK基因序列,得到10个保守性较高的motif(图1:B),并且motif间的排布具有一定规律:3′端排布顺序相同,均为motif 5-motif 4-motif 7-motif 1-motif 2-motif 3; 5′端排布顺序分为motif 9- motif 6-motif 10-motif 8和motif 8-motif 6-motif 9-motif 10两类。可见,小立碗藓LYK家族成员均具有motif 5-motif 4-motif 7-motif 1-motif 2-motif 3的相对稳定结构,且位于基因3′端,各成员的5′端会出现motif排列顺序的差异。MEME预测的小立碗藓LYK蛋白motif信息见表2。发现小立碗藓LYK蛋白的motif长度最小为29,最大为50,并且存在长度相同的motif。
通过SMART网站和Pfam网站分析小立碗藓LYK蛋白保守结构域,即通常所说的domain,结果如图2和图1:C所示。21个LYK蛋白均含有激酶结构域和LysM结构域,但所含LysM结构域的个数存在一定差异。利用进化树软件MEGA7.0构建小立碗藓LYK基因家族的系统发育树(图1:A),发现21个LYK家族成员从上至下分为3个分支。为更准确地分类,后文与已鉴定的3种模式植物的LYK成员一同构建系统进化树,以更好地了解物种与进化之间的联系。
分析21个小立碗藓LYK基因的外显子、内含子结构(图1:C),发现约62%的LYK基因含有1~3个内含子;其中有6个LYK基因均含有13个内含子,分别为PpLYK9、PpLYK10、PpLYK11、PpLYK12、PpLYK13、PpLYK15; PpLYK16含有14个内含子,为21个基因中内含子数量最多的基因,猜测其编码的蛋白生物学功能较为多样。LysM-RLKs家族中未发现不含内含子的成员,其中PpLYK14为仅有的不含非编码区的LYK基因。 将所有LysM-RLKs家族成员的保守结构域和红色菱形框表示小立碗藓LYK基因,蓝色框表示蒺藜苜蓿LYK基因,绿色三角形表示水稻LYK基因,棕色圆形表示拟南芥LYK基因。
The red diamond-shaped box represents the LYK genes of Physcomitrella patens, the blue box represents the LYK genes of Medicago truncatula , the green triangle represents the LYK genes of Oryza sativa, and the brown circle represents the LYK genes of Arabidopsis thaliana.
基因结构整合在一起(图1:C),可以发现两类特征结构域(LysM和PKc_like)均存在于基因编码区(即CDS),说明这两类结构域均对基因的功能起作用。由图1:C可知,PpLYK9至PpLYK13在外显子-内含子结构上与其他LYK家族成员存在显著差异。
2.3 小立碗藓LYK蛋白的系统发育分析
通过MEGA7.0对小立碗藓LYK基因家族成员的蛋白序列进行多序列比对后构建系统发育树(图1:A),结果显示,其LYK基因家族的系统发育树有3个非常明显的分支,3大分支中均发现了独立的进化分支,说明小立碗藓LYK基因家族成员在漫長的进化历史中产生了不同的进化方式,推测同一大分支延伸出的不同分支成员间功能可能有所差异。
为了进一步将小立碗藓LYK基因家族成员分类并研究其与其他植物LYK基因间的进化关系,分别选取10个水稻(单子叶模式植物)、5个拟南芥(双子叶模式植物)和23个蒺藜苜蓿(豆科模式植物)中已鉴定出的所有LysM-RLK基因的氨基酸序列,与小立碗藓LysM-RLK共同构建系统进化树,结果如图3所示。4种植物中的LYK蛋白存在于4个亚族(LYK-I、LYK-Ⅱ、LYR-I、LYR-Ⅱ)中,而小立碗藓LYK蛋白仅存在于2个亚家族:LYK-Ⅱ和LYR-I。LYK-Ⅱ亚族中有8个小立碗藓LYK家族成员(PpLYK9-PpLYK16),另外13个成员属于LYR-I亚族。LYK-Ⅱ亚族中的小立碗藓LYK家族成员有两个分支,同源性在90%以上;LYR-I亚族中的小立碗藓LYK家族成员也存在两个分支,同源性在90%以上,可能为直系同源基因。
2.4 小立碗藓LYK基因家族的染色体定位
通过Ensembl Plants数据库获得小立碗藓LYK染色体定位信息,将小立碗藓21个LYK基因定位在4条染色体上,结果如图4所示。小立碗藓第7条染色体上定位了9个基因,为定位LYK基因数目最多的一条染色体;第1条、第9条、第11条染色体上分别定位了3、5、4个基因,可见小立碗藓21个LYK基因在染色体分布上是相对集中的。从图4中可明显看到在4条染色体上均出现小型基因簇,根据基因簇的定义,基因簇成员在结构和功能上可能具有明显的相似性。其中,4条染色体上均出现位置接近的基因,如1号染色体上基因PpLYK6、PpLYK7和PpLYK8,9号染色体上的PpLYK17、PpLYK18、PpLYK19、PpLYK20 和PpLYK21等,可能为串联重复。
3 讨论与结论
本研究鉴定了小立碗藓基因组中的LysM-RLK基因,并对其进行生物信息学相关分析。本研究共鉴定出小立碗藓中21个LysM-RLK家族成员,它们在染色体上的分布相对集中,仅位于4条染色体上,且出现5组小型基因簇,推测可能为串联重复。每个LYK均含有1~3个LysM保守结构域和1个激酶结构域,MEME结果显示同一亚家族各成员具有相同或相似的domain,说明该亚家族成员可能在小立碗藓整个生命过程中执行相似的功能。
从LysM-RLK家族成员数量看,小立碗藓(21个)多于拟南芥(5个)和水稻(10个)中LYK基因个数,和蒺藜苜蓿(23个)同源家族的数量相差不大。研究发现该家族成员在高等植物中普遍存在较多成员,如苹果中有12个LysM-RLK,百脉根(Lotus japonicus)中有17个LysM-RLK(Lohmann et al., 2010;周喆等,2014)。小立碗藓是早期登陆的植物代表,其LysM-RLK家族成员数量多于拟南芥和水稻,推测该家族成员在小立碗藓中可能存在基因功能的冗余。随着不断进化,一些高等植物中LysM-RLK家族成员数量得到扩展,意味着该家族新功能的引入。
通过系统进化分析,将小立碗藓LysM-RLK基因分为2个亚组(LYK-Ⅱ和LYR-I),它们均与水稻、拟南芥和蒺藜苜蓿同源家族中的部分成员聚为一类,而高等植物中LysM-RLK家族分为4个亚组, 推测小立碗藓中LysM-RLK家族成员的功能相对单一。与进化分析表征相似,同一亚组内,LYK基因的外显子-内含子的排布特征较为接近,同时,此基因结构特征与水稻、拟南芥和蒺藜苜蓿的外显子-内含子分布特征较为相似(Shiu et al., 2004;Arrighi et al., 2006)。综上所述,同一亚组内基因家族成员具有相近的保守域特征、同源关系和基因结构特征,说明其可能具有相同或相似的功能。
LysM型类受体蛋白激酶基因在植物生长发育及逆境胁迫中发挥重要功能,已成为当今植物中基因功能研究的热点之一。LysM-RLK基因家族在高等植物中数量较多,功能也具有多样性,在小立碗藓中功能的研究不够深入,大部分LYK基因功能尚不明确。本研究在已有数据库资源的基础上,在小立碗藓中筛选得到21个LYK基因,并利用生物信息学方法,对其LYK基因家族成员进行蛋白特征、染色体定位、基因结构及进化关系等分析,将小立碗藓LYK基因家族进行初步分类,从基因层面显示了小立碗藓的特征,为之后研究LysM型类受体蛋白激酶功能提供了理论依据。 參考文献:
AFZAL AJ, WOOD AJ, LIGHTFOOT DA, 2008. Plant receptor-like serine threonine kinases: Roles in signaling and plant defense [J]. Mol Plant Microb Inter, 21(5): 507-517.
ARRIGHI JF, BARRE A, AMOR BB, et al., 2006. The medicago truncatula lysine motif-receptor-like kinase gene family includes NFP and new nodule-expressed genes [J]. Plant Physiol, 142(1): 265-279.
CHEN CJ, CHEN H, HE YH, et al., 2018. TBtools, a Toolkit for biologists integrating various biological data handling tools with a user-friendly interface [J]. Mol Plant. DOI: 10.1016/j.molp.2020.06.009.
CHEN ZH, 2019. Conservation and functional differentiation of E (z) homologous genes in plants [D]. Fuzhou: Fujian Agriculture and Forestry University. [陈紫华, 2019. 植物中E(z)同源基因的保守性和功能分化研究 [D]. 福州: 福建农林大学.]
KERSEY PJ, ALLEN JE, ALLOT A, et al., 2018. Ensembl genomes 2018: An integrated omics infrastructure for non-vertebrate species [J]. Nucl Acid Res, 46(D1): D802-D808.
EDGAR RC, 2004. MUSCLE: Multiple sequence alignment withhigh accuracy and high throughput [J]. Nucl Acid Res, (5): 5.
FAN YL, 2009. Simple repeated sequence analysis of the genome of Xanthomonas oryzae PV. oryzae [J]. Anhui Agric Sci, 273 (20): 9387-9390. [樊颖伦, 2009. 水稻白叶枯病菌基因组简单重复序列分析 [J]. 安徽农业科学, 273(20): 9387-9390.]
ARRIGHI JF, ANNICK B, BEN AB, et al., 2006. The Medicago truncatula Lysine Motif-Receptor-Like Kinase Gene Family Includes NFP and New Nodule-Expressed Genes [J]. Plant Physiol, 142(1): 265-279.
LEHTI-SHIU MD, ZOU C, HANADA K, et al., 2009. Evolutionary history and stress regulation of plant receptor-like kinase/pelle genes [J]. Plant Physiol, 150(1): 12-26.
LIMPENS E, FRANKEN C, SMIT P, et al., 2003. LysM domain receptor kinases regulating rhizobial nod factor-induced infection [J]. Science, 302(5645): 630-633.
LOHMANN GV, SHIMODA Y, NIELSEN MW, et al., 2010. Evolution and regulation of the Lotus japonicus LysM receptor gene family [J]. Mol Plant Microb Inter, 23(4):510-521.
POOLE RL, 2007. The TAIR database [J]. Methods Mol Biol, 406(406): 179-212.
RADUTOIU S, MADSEN LH, MADSEN EB, et al., 2003. Plant recognition of symbiotic bacteria requires two LysM receptor-like kinases [J]. Nature, 425(6958): 585-592.
RENSING SA, ROMBAUTS S, PEER YVD, et al., 2002. Moss transcriptome and beyond[J]. Trend Plant Sci, 7(12):535-538.
STONE J, 1995. Plant protein kinase families and signal transduction [J]. Plant Physiol, 108(2): 451-457. SHIU S, KARLOWSKI WM, PAN R, et al., 2004. Comparative analysis of the receptpes-like kinase family in Arabidopsis and rice [J]. Plant Cell, 16: 1220-1234.
SONG XQ, 2016. Cloning and functional analysis of the super-accumulating SaCAD gene of Jingtiandongtian [D]. Beijing: Chinese Academy of Forestry. [宋希茜, 2016. 超积累型东南景天SaCAD基因的克隆及其功能分析 [D]. 北京: 中国林业科学研究院.]
SAGULENKO P, PULLER V, NEHER RA, 2018. TreeTime: Maximum-likelihood phylodynamic analysis [J]. Virus Evol, 4(1): 1.
SHIU SH, KARLOWSKI WM, PAN R, et al., 2004. Comparative analysis of the receptor-like kinase family in Arabidopsis and rice [J]. Plant Cell, 16(5): 1220-1234.
TIAN LM, 2016. Identification, expression pattern analysis and functional study of tomato IMPα/β and LYK family genes [D]. Hangzhou: Zhejiang University. [田丽梅, 2016. 番茄IMPα/β和LYK家族基因的鉴定、表达模式分析和功能研究 [D]. 杭州: 浙江大学.]
WAN J , ZHANG XC , NEECE D, et al., 2008. A LysM receptor-like kinase plays a critical role in chitin signaling and fungal resistance in Arabidopsis [J]. Plant Cell Online, 20(2): 471-481.
WANG L, LI G, WANG JH, et al., 2009. Molecular cloning and evolutionary analysis of the GJA1 (connexin43) gene from bats (Chiroptera) [J]. Genet Res, 91(2): 101-109.
ZHANG XC, WU XL, FINDLEY S, et al., 2007. Molecular evolution of Lysin motif-type receptor-like kinase in plants [J]. Plant Physiol, 144(2): 623-636.
ZHOU Z, ZHANG CX, ZHANG LY, et al., 2014. Bioinformatics and expression analysis of the LysM gene family in apple [J]. Chin J Agric Sci, 41(13): 2602-2612. [周喆, 張彩霞, 张利义, 等,2014. 苹果LysM基因家族的生物信息学及表达分析 [J]. 中国农业科学, 47(13): 2602-2612.]
(责任编辑 何永艳)