论文部分内容阅读
摘要[目的]从全基因组范围鉴定葡萄热休克转录因子基因家族,并对其基因结构、蛋白结构、基因启动子、基因在进化中受到的选择压力以及其编码基因在非生物胁迫下的表达变化进行综合分析,并对葡萄热休克转录因子基因家族的密码子使用偏好性进行研究,分析影响葡萄热休克转录因子基因家族密码子使用偏好性的因素。[方法]利用葡萄基因组数据库相关数据建库结合本地BLAST法鉴定序列,利用多重序列比对,进化树构建等生物信息学方法进行分析。[结果]鉴定了20个葡萄热休克转录因子,并将其分为4个亚组。其中9个热休克转录因子基因在冷胁迫1 h下表达上调,2个在冷胁迫4 h下表达上调。在高温胁迫14 d条件下,7个热休克转录因子基因表达量下调。在高温胁迫42 d条件下,8个热休克转录因子基因表达量下调。此外发现,葡萄热休克转录因子家族各成员基因存在密码子使用偏好性。[结论]该研究为深入研究葡萄热休克转录因子的功能提供了有用的信息。
关键词热休克转录因子;葡萄;非生物胁迫;选择压力;密码子偏好性
中图分类号S188文献标识码A文章编号0517-6611(2017)32-0144-08
Genomewide Identification and Analysis of the Heat Shock Transcription Factor Family Genes in Grape
WANG Pengfei,SU Ling,JIANG Xilong,REN Fengshan*,WANG Yongmei* et al
(Shandong Grape Research Institute,Jinan,Shandong 250100)
Abstract[Objective]To identify and analyze the Hsfs from grape genome, and study the expression of Hsf genes in grape in various stress conditions, gene structure of grape Hsf, cisregulation elements of grape Hsf promoters, conserved motif of grape Hsf protein, structure of grape Hsf protein, selection pressure which the grape Hsf genes underwent in evolution history and so on. Additonally, to study the codon bias of grape Hsf gene family.[Method]The amino acid sequences of Hsfs were extracted from grape genome database using BLAST programs. Protein multiple sequence alignment and neighborJoining (NJ) trees were constructed.[Result] We identified 20 grape Hsfs. According to phylogenetic relationship, these Hsfs were divided into A, B, C and D subfamilies. The expression of 9 Hsfs were upregulated under cold stress in 1 hour and 2 were upregulated under cold stress in 4 hours. The expression of 7 Hsfs were downregulated under heat stress in 14 days and 8 were downregulated under heat stress in 42 days. Additionally, there had codon bias in grape Hsf family members.[Conclusion]The study provided useful information for further understanding the function of Hsfs in grape.
Key wordsHeat shock transcription factors;Grape;Abiotic stress;Selection pressure;Codon bias
非生物脅迫包括热胁迫、冷胁迫以及盐胁迫等。这些非生物胁迫影响植物正常的生长发育并会导致严重的作物减产[1-3]。植物作为固着生物,不能依靠移动来逃避非生物胁迫压力[4]。然而,植物为了适应环境,已经进化出了一系列应对这些非生物胁迫的策略[4-5]。在植物适应非生物胁迫策略中以及植物对环境压力的耐受过程中,转录因子起到了关键的作用。转录因子调控成百上千的基因表达,使得植物可以耐受逆境[6-9]。
植物热休克转录因子(heat shock transcription factors,Hsf)是一种重要的转录因子,这类转录因子可以使植物在热、冷、干、盐胁迫中所受的伤害减小[2,4,10-14]。 热休克转录因子还可以通过激活相关的基因来保护细胞免遭极端毒性的伤害[15-18]。研究显示,热休克转录因子还涉及植物生长和发育[19-21]。
与其他转录因子类似,热休克转录因子具有N端的DNA绑定结构域(Nterminal DNA binding domain,DBD)。而热休克转录因子的DNA绑定结构域与一段寡聚化功能结构域(oligomerization domain,OD)相邻。寡聚化功能结构域是由两段疏水性的七肽重复序列(hydrophobic heptad repeats,HRA/B)组成。这两段疏水性的七肽重复序列可以形成一个亮氨酸拉链型蛋白质相互作用螺旋线圈结构域(leucine zippertype protein interaction coiledcoil domain)[22-25]。有的植物熱休克转录因子含有核定位信号结构域(nuclear location signal,NLS),核输出信号结构域(nuclear export signal,NES)或C端激活结构域(Cterminal activation AHA)[4,26-29]。 目前的研究显示,基于疏水性的七肽重复序列的结构以及进化树分析,植物热休克转录因子一般被划分为A、B和C共3个亚家族[2,9,11,17]。
葡萄(Vitis vinifera L.)是一种重要的果树,随着葡萄基因组序列的公布以及最新拼接注释版本的公布,全基因范围鉴定葡萄热休克转录因子基因以及对其深入分析已成为可能。该研究从全基因组范围鉴定葡萄热休克转录因子基因家族,并对其基因结构、蛋白结构、启动子、进化中受到的选择压力进行综合分析;同时对葡萄热休克转录因子基因家族密码子使用偏好性进行研究,分析影响葡萄热休克转录因子基因家族密码子使用偏好性的因素。
1材料与方法
1.1序列筛选
葡萄基因组数据以及相关的蛋白,CDs数据从最新版本葡萄基因组数据库(http://www.genoscope.cns.fr/externe/GenomeBrowser/Vitis/)中获得,数据库版本为V2.0。热休克转录因子的最保守结构域为Hsftype DBD结构域,该结构域的HMM ID为PF00447。从Pfam数据库(http://pfam.xfam.org/)中获得该结构域的最保守模型序列,用该序列进行本地BLAST(E<0.001),从而搜索葡萄中全部的热休克转录因子。利用在线软件SMART(http://smart.emblheidelberg.de/)确定这些搜索到的葡萄热休克转录因子是否具有完整的Hsftype DBD结构域,并检测其他的功能结构域,如HRA/B。没有完整Hsftype DBD结构域的序列被过滤,不被用于研究。
1.2多重序列比对与进化树分析
利用在线软件Clustal Omega(http://www.ebi.ac.uk/Tools/msa/clustalo)进行蛋白多重序列比对分析。利用MEGA 6.0软件构建邻接进化树(NeighborJoining tree)。进化树包括该研究搜索到的20个葡萄热休克转录因子和前人研究的21个拟南芥热休克转录因子,全部热休克转录因子的基因ID见表1。
1.3保守基序(motif)分析
利用在线软件Multiple Em for Motif Elicitation(MEME)suite 4.11.1(http://meme.nbcr.net/meme/)鉴定葡萄热休克转录因子蛋白中保守的基序(motif)(参数设置为output motifs:20;minimum motif width:6;maximum motif width:300)。
1.4基因结构可视化作图
采用在线软件Gene Structure Display Server 2.0(http://gsds.cbi.pku.edu.cn/)对葡萄热休克转录因子的基因结构进行可视化作图,并分析内含子的相位。
1.5选择压力分析
利用Codeml program under PAML(phylogenetic analysis maximum likelihood)version 4.7 software软件[30]分析葡萄热休克转录因子基因家族在进化过程中遭受何种选择压力。该软件分析包括6个位点模型分析:M0(one ratio)、M1a(neutral)、M2a(positive selection)、M3(discrete),M7(beta)以及M8(beta and ω)模型。其中M0与M3,M1a与M2a 以及M7与M8 模型之间的两两比较可以用于发掘正向选择位点[31]。
1.6基因表達分析
葡萄热休克转录因子基因在葡萄各个组织中,高温胁迫诱导和冷胁迫诱导等表达的芯片表达谱数据从Plant Expression Database(http://www.plexdb.org/)数据库以及GEO数据库(www.ncbi.nlm.nih.gov/geo/query/)中进行收集。MAS5calculated Signal intensity Value作为标准化的表达量用于差异基因分析和可视化热图绘制,热图用Mev4.0软件进行绘制。
1.7启动子分析
收集葡萄热休克转录因子基因起始密码子上游1 500 bp作为启动子序列用于下一步分析。利用在线软件PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行启动子分析,鉴定葡萄热休克转录因子基因启动子中的顺式调控元件。
1.8密码子偏好性分析
1.8.1密码子使用偏好性参数的计算。
利用CodonW1.4软件计算同义密码子相对使用频率(relativesynonymous codonusage,RSCU)、有效密码子数(effective number of codon,ENC)、最优密码子使用频率(frequencyof optimal codons,Fop),GC3s(GC3s为密码子第三位GC含量),密码子偏爱指数(codon bias index,CBI),密码子适应指数(codon adaptation index,CAI)等参数。
1.8.2相关性分析。
为了研究密码子使用偏好性所受到的影响因素,该研究还分析了Fop、CBI、CAI与外显子数目、外显子GC含量、外显子GC3s的相关性。
2结果与分析
2.1葡萄Hsf家族的鉴定与进化树分析
根据葡萄基因组中的全蛋白数据建库,利用Hsftype DBD domains(Pfam:PF00447)保守模型序列进行本地BLAST,并利用SMART筛除软件假阳性序列,共鉴定出20个葡萄热休克转录因子(表1)。序列长度最小的葡萄熱休克转录因子基因ID为VIT_205s0029g00340,长度为96个氨基酸;序列长度最大的葡萄热休克转录因子基因ID为VIT_211s0016g02010,长度为663个氨基酸。 利用這20个葡萄热休克转录因子和21个拟南芥热休克转录因子的全长蛋白序列构建进化树。按照进化树显示的进化关系以及之前对拟南芥热休克转录因子的分组研究[4],发现拟南芥热休克转录因子家族可以被划分为A、B、C 3组,而葡萄热休克转录因子家族可以被划分为A、B、C和D共4个大组。其中,A大组又可以被划分为A1、A2、A3、A4、A6、A7、A8和A9共9个亚组;而B大组又可以被划分为B1、B2、B3和B4共4个亚组(图1)。以往研究表明,植物热休克转录因子家族基于疏水性的七肽重复序列结构,以及进化树分析一般可以被分为A、B和C共3个亚家族[2,9,11,17]。而该研究进化树结果显示,葡萄热休克转录因子中存在一个不同的亚家族,将其命名为D组,包括2个成员:VIT_205s0029g00350和VIT_208s0007g03900。
蛋白序列的多重比对分析显示,D组这2个成员疏水性的七肽重复序列的结果也与A、B、C组成员略有不同(图2),这从一定程度上支持了进化树的结论。与拟南芥相同,葡萄热休克转录因子的C组成员也只包含1个成员VIT_211s0016g03940。而葡萄热休克转录因子家族中不存在A3、A5、A7和A9亚组的成员。
安徽农业科学2017年
2.2葡萄Hsf家族的特征
大部分的葡萄热休克转录因子基因含有1个内含子和2个外显子,而VIT_208s0007g03900没有内含子。VIT_211s0016g02010含有12个外显子和11个内含子。大部分葡萄热休克转录因子基因的内含子的相位是相位0,除了VIT_204s0008g01110含有1个相位1的内含子,VIT_204s0008g01110含有1个相位1的内含子,VIT_211s0016g02010含有3个相位1的内含子和3个相位2的内含子(图3)。整个葡萄热休克转录因子基因家族的49个外显子中只有2个对称外显子。过多的对称外显子会造成外显子的复制和重排[32-33]。通过分析葡萄热休克转录因子基因家族的基因结构,发现葡萄热休克转录因子基因结构相对比较稳定。
而蛋白二级结构分析显示,相对于疏水性的七肽重复序列,葡萄热休克转录因子家族的DNA绑定结构域相对保守(图4)。
采用The Multiple EM for Motif Elicitation(MEME)基序研究工具分析蛋白二级结构分析。在葡萄热休克转录因子家族中,发现了20个保守的基序(motif),大部分家族成员包含motif1和motif3。然而,D组的2个家族成员都不含有motif1和motif3。大部分B组成员含有特殊的motif4,而部分A组成员含有特殊的motif6,部分A组成员含有特殊的motif20(图5)。表2为葡萄热休克转录因子最保守的motif基序序列。
2.3葡萄Hsf家族的选择压力分析
利用Codeml program under PAML软件中的位点模型分析不同葡萄热休克转录因子亚家族在进化中所遭受的选择压力,探索是否不同亚家族遭遇不同的选择压力。选择压力(selective pressure),又称为进化压力,指外界施与一个生物进化过程的压力,从而改变该过程的前进方向。当该亚家族的Ka/Ks(ω)>1,说明该亚家族受到正向选择(positive selection);当该亚家族的Ka/Ks(ω)=1,说明该亚家族受到中性选择(neutral selection),当该亚家族的Ka/Ks(ω)<1,说明该亚家族受到纯化选择(purifying selection)。由于葡萄热休克转录因子的C组只包含1个基因,所有只分析A、B和D组在葡萄进化中所受到的选择压力。
结果显示,葡萄A组热休克转录因子在进化过程中遭遇了纯化选择(ω=0.69 069)。M1a与M2a比较分析发现了41个正向选择位点,其中包括1个显著(P<0.01)的正向选择位点 409 G[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了120个正向选择位点,其中包括2个显著(P<0.01)的正向选择位点400 - 和409 G[Bayes Empirical Bayes(BEB)analysis]。葡萄B组热休克转录因子在进化过程中遭遇了纯化选择(ω= 0.41 679)。M1a与M2a比较分析未发现正向选择位点[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了40个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。葡萄D组热休克转录因子在进化过程中遭遇了纯化选择(ω= 0.63 930)。M1a与M2a比较分析发现了68个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了68个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。
2.4葡萄Hsf家族基因在不同非生物脅迫下的表达
利用前人研究的基因芯片表达谱数据,对在4 ℃低温胁迫处理1 h与4 h的葡萄茎中葡萄热休克转录因子基因的表达变化进行了分析,数据来源为plexdb数据库与NCBI数据库,GEO Accession为GSE31594(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE31594)。结果显示,在4 ℃低温胁迫处理1 h葡萄茎中,有9个(VIT_218s0001g10380、VIT_211s0016g02010、VIT_211s0016g03940、VIT_205s0020g04090、VIT_202s0025g04170、VIT_205s0029g00340、VIT_210s059 7g00050、VIT_204s0008g01110、VIT_210s0003g01770) 葡萄热休克转录因子基因上调2.0倍以上,其中8个(VIT_218s0001
2.5葡萄Hsf家族基因启动子的顺式作用元件
利用在线软件PLANTCARE分析了葡萄热休克转录因子家族基因的启动子序列(起始密码子上游1 500 bp),结果显示大部分的葡萄热休克转录因子家族基因的启动子含有顺式作用元件LTR(low temperature responsive),与低温诱导相关。大部分的葡萄热休克转录因子家族基因的启动子含有顺式作用元件MBS element(MYBbinding drought inducible),与MYB转录因子结合和干旱诱导相关。部分葡萄热休克转录因子家族基因的启动子含有顺式作用元件G-box,与bHLH转录因子结合相关。部分葡萄热休克转录因子家族基因的启动子含有顺式作用元件HSE,说明可能有的葡萄热休克转录因子基因的表达可能受热休克转录因子调控。
2.6相关性分析显示密码子使用偏好性可能受到的影响
利用软件CodonW1.4计算葡萄热休克转录因子家族各成员基因的密码子使用偏好性指数。通过指数发现,葡萄热休克转录因子家族各成员基因存在密码子使用的偏好性。很多葡萄热休克转录因子家族各成员基因,例如VIT_200s0179g001基因中,编码苯丙氨酸(Phe)的密码子UUU的RSCU值为1.30,而编码苯丙氨酸(Phe)的密码子UUC的RSCU值为0.70。这说明UUU是高频使用的密码子,更被偏好使用。
葡萄热休克转录因子家族外显子的平均GC含量为47.37%,平均GC3s为47.45%,平均Fop为0.40 825,平均CAI为0.20 450,平均CBI为-0.02 605。
为进一步揭示密码子使用偏好性,该研究分析了Fop、CAI、CBI与外显子数目、外显子GC含量、外显子GC3s的相关性。结果表明,Fop与GC含量呈显著正相关(r=0.70,P<0.01)(图8a);Fop与GC3s呈显著正相关(r=0.76,P<
0.01)(图8b);Fop与GC含量与GC3s相关性较强,表明葡萄热休克转录因子基因外显子密码子使用偏好性受突变压力(GC含量)影响;而Fop与外显子数目相关性不强(r=0.20,P<0.01)(图8c);CBI与GC含量呈显著正相关(r=0.71,P<0.01)(图8d);CBI与GC3s呈显著正相关(r=0.74,P<0.01)(图8e);CBI与GC含量与GC3s相关性较强,表明葡萄热休克转录因子基因密码子使用偏好性受突变压力(GC含量)影响;CBI与外显子数目相关性不强(r=0.17,P<0.01)(图8f);CAI与GC含量呈正相关,但相关性不强(r=0.28,P<0.01)(图8g);CAI与GC3s呈正相关(r=0.37,P<0.01)(图8h);CAI与外显子数目相关性不强(r=0.24,P<0.01)(图8i)。
3讨论
该研究从全基因组范围内鉴定葡萄热休克转录因子家族,共找出20个葡萄热休克转录因子家族成员。尽管利用拟南芥和葡萄热休克转录因子家族成员构建的进化树可以被分为4个大组,但是拟南芥热休克转录因子家族只含有A、B、C共3组的成员[4],而葡萄热休克转录因子家族可以被划分为A、B、C和D 4个大组。葡萄热休克转录因子的分组和拟南芥稍有不同。多重序列比对结果显示D组成员的主要结构域氨基酸序列与A、B、C组成员都略有差异。
葡萄热休克转录因子各成员的基因结构相似,大部分由2个外显子和1个内含子构成,结构较为单一。整个葡萄热休克转录因子基因家族的49个外显子中只有2个对称外显子。过多的对称外显子会造成外显子的复制和重排[32-33],说明葡萄热休克转录因子基因结构相对比较稳定。不同亚组成员的motif具有特异的保守基序,说明不同的亚组成员可能存在功能差异。尽管各个亚组所受到的选择压力都为纯化选择,说明同一亚组成员之间的功能差异可能不大,但是通過检测到的多个正向选择位点,说明同一亚组成员之间的功能也可能存在分歧或新功能的出现。
在不同非生物胁迫(高温和冷)处理下,不同葡萄热休克转录因子基因的表达发生显著变化,说明部分葡萄热休克转录因子可能涉及高温胁迫和低温胁迫的耐受。在不同非生物胁迫处理下,不同葡萄热休克转录因子基因表达量变化各有异同,也说明不同的葡萄热休克转录因子可能参与了不同胁迫的耐受,即功能可能存在差异。这些基因在不同胁迫下表现出的表达差异可能与启动子顺式调控元件的差异相关,例如有的葡萄热休克转录因子基因含有LTR元件,说明可能受到低温的直接诱导。而有的含有顺式调控元件,例如MBS、G-box,说明部分葡萄热休克转录因子基因的表达变化可能是受到其他转录因子的间接影响。
密码子使用偏好性研究显示,葡萄热休克转录因子家族各成员基因存在密码子使用的偏好性,而这种偏好性可能是受突变压力(GC含量)影响[34-35]。
4结论
该研究鉴定并分析了葡萄热休克转录因子家族,一些葡萄熱休克转录因子基因在非生物胁迫下的表达模式显示其在葡萄对环境压力的响应中起到了作用。该研究结果为深入研究葡萄热休克转录因子的功能提供了有用的信息。
参考文献
[1] ALWHAIBI M H.Plant heatshock proteins:A mini review[J].Journal of king saud universityscience,2011,23(2):139-150.
[2] QIAO X,LI M,LI L T,et al.Genomewide identification and comparative analysis of the heat shock transcription factor family in Chinese white pear(Pyrus bretschneideri)and five other Rosaceae species[J].BMC plant biology,2015,15(1):12. [3] WANG W X,VINOCUR B,SHOSEYOV O,et al.Role of plant heatshock proteins and molecular chaperones in the abiotic stress response[J].Trends in plant science,2004,9(5):244-252.
[4] GUO M,LIU J H,MA X,et al.The plant heat stress transcription factors (HSFs):Structure,regulation and function in response to abiotic stresses[J].Frontiers in plant science,2016,7:1-13.
[5] SCHARF K D,BERBERICH T,EBERSBERGER I,et al.The plant heat stress transcription factor(Hsf)family:Structure,function and evolution[J].Biochimica et biophysica acta,2012,1819(2):104-119.
[6] SCHWECHHEIMER C,BEVAN M.The regulation of transcription factor activity in plants[J].Trends in plant science,1998,3(98):378-383.
[7] KREPS J A,WU Y J,CHANG H S,et al.Transcriptome changes for Arabidopsis in response to salt,osmotic,and cold stress[J].Plant physiology,2002,130(4):2129-2141.
[8] SHINOZAKI K,YAMAGUCHISHINOZAKI K.Gene networks involved in drought stress response and tolerance[J].Journal of experimental botany,2007,58(2):221-227.
[9] WANG J,SUN N,DENG T,et al.Genomewide cloning,identification,classification and functional analysis of cotton heat shock transcription factors in cotton(Gossypium hirsutum)[J].BMC genomics,2014,15(1):961.
[10] HU Y,HAN Y T,WEI W,et al.Identification,isolation,and expression analysis of heat shock transcription factors in the diploid woodland strawberry Fragaria vesca[J].Frontiers in plant science,2015,6:736.
[11] VON KOSKULLD RING P,SCHARF K D,NOVER L.The diversity of plant heat stress transcription factors[J].Trends in plant science,2007,12(10):452-457.
[12] KOTAK S,LARKINDALE J,LEE U,et al.Complexity of the heat stress response in plants[J].Current opinion in plant biology,2007,10(3):310-316.
[13] SWINDELL W R,HUEBNER M,WEBER A P.Transcriptional profiling of Arabidopsis heat shock proteins and transcription factors reveals extensive overlap between heat and nonheat stress response pathways[J].BMC genomics,2007,8(1):125.
[14] LI P S,YU T F,HE G H,et al.Genomewide analysis of the Hsf family in soybean and functional identification of GmHsf34 involvement in drought and heat stresses[J].BMC genomics,2014,15(1):1009.
[15] DALTON T P,SOLIS W A,NEBERT D W,et al.Characterization of the MTF1 transcription factor from zebrafish and trout cells[J].Comparative biochemistry and physiology Part B:Biochemistry and molecular biology,2000,126(3):325-335.
[16] AKERFELT M,MORIMOTO R I,SISTONEN L.Heat shock factors:Integrators of cell stress,development and lifespan[J].Nature reviews molecular cell biology,2010,11(8):545-555. [17] YANG Z F,WANG Y F,GAO Y,et al.Adaptive evolution and divergent expression of heat stress transcription factors in grasses[J].BMC evolutionary biology,2014,14:147.
[18] JAEGER A M,PEMBLE IV C W,SISTONEN L,et al.Structures of HSF2 reveal mechanisms for differential regulation of human heat shock factors[J].Nature structural & molecular biology,2016,23(2):147-154.
[19] ALMOGUERA C,ROJAS A,DIAZMARTIN J,et al.A seedspecific heatshock transcription factor involved in developmental regulation during embryogenesis in sunflower[J].Journal of biological chemistry,2002,277(46):43866-43872.
[20] DIAZMARTN J,ALMOGUERA C,PRIETODAPENA P,et al.Functional interaction between two transcription factors involved in the developmental regulation of a small heat stress protein gene promoter[J].Plant physiology,2005,139(3):1483-1494.
[21]
KOTAK S,VIERLING E,BUMLEIN H,et al.A novel transcriptional cascade regulating expression of heat stress proteins during seed development of Arabidopsis[J].The plant cell,2007,19(1):182-195.
[22] PETERANDERL R,RABENSTEIN M,SHIN Y K,et al.Biochemical and biophysical characterization of the trimerization domain from the heat shock transcription factor[J].Biochemistry,1999,38(12):3559-3569.
[23] NOVER L,BHARTI K,DRING P,et al.Arabidopsis and the heat stress transcription factor world:How many heat stress transcription factors do we need?[J].Cell stress & chaperones,2001,6(3):177-189.
[24] BANIWAL S K,BHARTI K,CHAN K Y,et al.Heat stress response in plants:A complex game with chaperones and more than twenty heat stress transcription factors[J].Journal of biosciences,2004,29(4):471-487.
[25] LIN Y X,CHENG Y,JIN J,et al.Genome duplication and gene loss affect the evolution of heat shock transcription factor genes in legumes[J].Plos one,2014,9(7):1-18.
[26] SORGER P K,PELHAM H R.Yeast heat shock factor is an essential DNAbinding protein that exhibits temperaturedependent phosphorylation[J].Cell,1988,54(6):855-864.
[27] DRING P,TREUTER E,KISTNER C,et al.The role of AHA motifs in the activator function of tomato heat stress transcription factors HsfA1 and HsfA2[J].The plant cell,2000,12(2):265-278.
[28] HSU A L,MURPHY C T,KENYON C.Regulation of aging and agerelated disease by DAF16 and heatshock factor[J].Science,2003,300(5622):1142-1145.
[29] MAERE S,DE BODT S,RAES J,et al.Modeling gene and genome duplications in eukaryotes[J].Proceedings of the national academy of sciences of the USA,2005,102(15):5454-5459.
[30] YANG Z H.PAML 4:Phylogenetic analysis by maximum likelihood[J].Molecular biology and evolution,2007 24(8):1586-1591.
[31] YANG Z H,NIELSEN R,GOLDMAN N,et al.Codonsubstitution models for heterogeneous selection pressure at amino acid sites[J].Genetics,2000,155(1):431-449.
[32] GILBERT W.The exon theory of genes[J].Cold spring harbor symposia on quantitative biology,1987,52(52):901-905.
[33] PATTHY L.Introndependent evolution:Preferred types of exons and introns[J].Febs letters,1987,214(1):1-7.
[34] CHEN S L,LEE W,HOTTES A K,et al.Codon usage between genomes is constrained by genomewide mutational processes[J].Proceedings of the national academy of sciences of the USA,2004,101(10):3480-3485.
[35] KNIGHT R D,FREELAND S J,LANDWEBER L F.A simple model based on mutation and selection explains trends in codon and aminoacid usage and GC composition within and across genomes[J].Genome Biology,2001,2(4):1-13.
关键词热休克转录因子;葡萄;非生物胁迫;选择压力;密码子偏好性
中图分类号S188文献标识码A文章编号0517-6611(2017)32-0144-08
Genomewide Identification and Analysis of the Heat Shock Transcription Factor Family Genes in Grape
WANG Pengfei,SU Ling,JIANG Xilong,REN Fengshan*,WANG Yongmei* et al
(Shandong Grape Research Institute,Jinan,Shandong 250100)
Abstract[Objective]To identify and analyze the Hsfs from grape genome, and study the expression of Hsf genes in grape in various stress conditions, gene structure of grape Hsf, cisregulation elements of grape Hsf promoters, conserved motif of grape Hsf protein, structure of grape Hsf protein, selection pressure which the grape Hsf genes underwent in evolution history and so on. Additonally, to study the codon bias of grape Hsf gene family.[Method]The amino acid sequences of Hsfs were extracted from grape genome database using BLAST programs. Protein multiple sequence alignment and neighborJoining (NJ) trees were constructed.[Result] We identified 20 grape Hsfs. According to phylogenetic relationship, these Hsfs were divided into A, B, C and D subfamilies. The expression of 9 Hsfs were upregulated under cold stress in 1 hour and 2 were upregulated under cold stress in 4 hours. The expression of 7 Hsfs were downregulated under heat stress in 14 days and 8 were downregulated under heat stress in 42 days. Additionally, there had codon bias in grape Hsf family members.[Conclusion]The study provided useful information for further understanding the function of Hsfs in grape.
Key wordsHeat shock transcription factors;Grape;Abiotic stress;Selection pressure;Codon bias
非生物脅迫包括热胁迫、冷胁迫以及盐胁迫等。这些非生物胁迫影响植物正常的生长发育并会导致严重的作物减产[1-3]。植物作为固着生物,不能依靠移动来逃避非生物胁迫压力[4]。然而,植物为了适应环境,已经进化出了一系列应对这些非生物胁迫的策略[4-5]。在植物适应非生物胁迫策略中以及植物对环境压力的耐受过程中,转录因子起到了关键的作用。转录因子调控成百上千的基因表达,使得植物可以耐受逆境[6-9]。
植物热休克转录因子(heat shock transcription factors,Hsf)是一种重要的转录因子,这类转录因子可以使植物在热、冷、干、盐胁迫中所受的伤害减小[2,4,10-14]。 热休克转录因子还可以通过激活相关的基因来保护细胞免遭极端毒性的伤害[15-18]。研究显示,热休克转录因子还涉及植物生长和发育[19-21]。
与其他转录因子类似,热休克转录因子具有N端的DNA绑定结构域(Nterminal DNA binding domain,DBD)。而热休克转录因子的DNA绑定结构域与一段寡聚化功能结构域(oligomerization domain,OD)相邻。寡聚化功能结构域是由两段疏水性的七肽重复序列(hydrophobic heptad repeats,HRA/B)组成。这两段疏水性的七肽重复序列可以形成一个亮氨酸拉链型蛋白质相互作用螺旋线圈结构域(leucine zippertype protein interaction coiledcoil domain)[22-25]。有的植物熱休克转录因子含有核定位信号结构域(nuclear location signal,NLS),核输出信号结构域(nuclear export signal,NES)或C端激活结构域(Cterminal activation AHA)[4,26-29]。 目前的研究显示,基于疏水性的七肽重复序列的结构以及进化树分析,植物热休克转录因子一般被划分为A、B和C共3个亚家族[2,9,11,17]。
葡萄(Vitis vinifera L.)是一种重要的果树,随着葡萄基因组序列的公布以及最新拼接注释版本的公布,全基因范围鉴定葡萄热休克转录因子基因以及对其深入分析已成为可能。该研究从全基因组范围鉴定葡萄热休克转录因子基因家族,并对其基因结构、蛋白结构、启动子、进化中受到的选择压力进行综合分析;同时对葡萄热休克转录因子基因家族密码子使用偏好性进行研究,分析影响葡萄热休克转录因子基因家族密码子使用偏好性的因素。
1材料与方法
1.1序列筛选
葡萄基因组数据以及相关的蛋白,CDs数据从最新版本葡萄基因组数据库(http://www.genoscope.cns.fr/externe/GenomeBrowser/Vitis/)中获得,数据库版本为V2.0。热休克转录因子的最保守结构域为Hsftype DBD结构域,该结构域的HMM ID为PF00447。从Pfam数据库(http://pfam.xfam.org/)中获得该结构域的最保守模型序列,用该序列进行本地BLAST(E<0.001),从而搜索葡萄中全部的热休克转录因子。利用在线软件SMART(http://smart.emblheidelberg.de/)确定这些搜索到的葡萄热休克转录因子是否具有完整的Hsftype DBD结构域,并检测其他的功能结构域,如HRA/B。没有完整Hsftype DBD结构域的序列被过滤,不被用于研究。
1.2多重序列比对与进化树分析
利用在线软件Clustal Omega(http://www.ebi.ac.uk/Tools/msa/clustalo)进行蛋白多重序列比对分析。利用MEGA 6.0软件构建邻接进化树(NeighborJoining tree)。进化树包括该研究搜索到的20个葡萄热休克转录因子和前人研究的21个拟南芥热休克转录因子,全部热休克转录因子的基因ID见表1。
1.3保守基序(motif)分析
利用在线软件Multiple Em for Motif Elicitation(MEME)suite 4.11.1(http://meme.nbcr.net/meme/)鉴定葡萄热休克转录因子蛋白中保守的基序(motif)(参数设置为output motifs:20;minimum motif width:6;maximum motif width:300)。
1.4基因结构可视化作图
采用在线软件Gene Structure Display Server 2.0(http://gsds.cbi.pku.edu.cn/)对葡萄热休克转录因子的基因结构进行可视化作图,并分析内含子的相位。
1.5选择压力分析
利用Codeml program under PAML(phylogenetic analysis maximum likelihood)version 4.7 software软件[30]分析葡萄热休克转录因子基因家族在进化过程中遭受何种选择压力。该软件分析包括6个位点模型分析:M0(one ratio)、M1a(neutral)、M2a(positive selection)、M3(discrete),M7(beta)以及M8(beta and ω)模型。其中M0与M3,M1a与M2a 以及M7与M8 模型之间的两两比较可以用于发掘正向选择位点[31]。
1.6基因表達分析
葡萄热休克转录因子基因在葡萄各个组织中,高温胁迫诱导和冷胁迫诱导等表达的芯片表达谱数据从Plant Expression Database(http://www.plexdb.org/)数据库以及GEO数据库(www.ncbi.nlm.nih.gov/geo/query/)中进行收集。MAS5calculated Signal intensity Value作为标准化的表达量用于差异基因分析和可视化热图绘制,热图用Mev4.0软件进行绘制。
1.7启动子分析
收集葡萄热休克转录因子基因起始密码子上游1 500 bp作为启动子序列用于下一步分析。利用在线软件PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行启动子分析,鉴定葡萄热休克转录因子基因启动子中的顺式调控元件。
1.8密码子偏好性分析
1.8.1密码子使用偏好性参数的计算。
利用CodonW1.4软件计算同义密码子相对使用频率(relativesynonymous codonusage,RSCU)、有效密码子数(effective number of codon,ENC)、最优密码子使用频率(frequencyof optimal codons,Fop),GC3s(GC3s为密码子第三位GC含量),密码子偏爱指数(codon bias index,CBI),密码子适应指数(codon adaptation index,CAI)等参数。
1.8.2相关性分析。
为了研究密码子使用偏好性所受到的影响因素,该研究还分析了Fop、CBI、CAI与外显子数目、外显子GC含量、外显子GC3s的相关性。
2结果与分析
2.1葡萄Hsf家族的鉴定与进化树分析
根据葡萄基因组中的全蛋白数据建库,利用Hsftype DBD domains(Pfam:PF00447)保守模型序列进行本地BLAST,并利用SMART筛除软件假阳性序列,共鉴定出20个葡萄热休克转录因子(表1)。序列长度最小的葡萄熱休克转录因子基因ID为VIT_205s0029g00340,长度为96个氨基酸;序列长度最大的葡萄热休克转录因子基因ID为VIT_211s0016g02010,长度为663个氨基酸。 利用這20个葡萄热休克转录因子和21个拟南芥热休克转录因子的全长蛋白序列构建进化树。按照进化树显示的进化关系以及之前对拟南芥热休克转录因子的分组研究[4],发现拟南芥热休克转录因子家族可以被划分为A、B、C 3组,而葡萄热休克转录因子家族可以被划分为A、B、C和D共4个大组。其中,A大组又可以被划分为A1、A2、A3、A4、A6、A7、A8和A9共9个亚组;而B大组又可以被划分为B1、B2、B3和B4共4个亚组(图1)。以往研究表明,植物热休克转录因子家族基于疏水性的七肽重复序列结构,以及进化树分析一般可以被分为A、B和C共3个亚家族[2,9,11,17]。而该研究进化树结果显示,葡萄热休克转录因子中存在一个不同的亚家族,将其命名为D组,包括2个成员:VIT_205s0029g00350和VIT_208s0007g03900。
蛋白序列的多重比对分析显示,D组这2个成员疏水性的七肽重复序列的结果也与A、B、C组成员略有不同(图2),这从一定程度上支持了进化树的结论。与拟南芥相同,葡萄热休克转录因子的C组成员也只包含1个成员VIT_211s0016g03940。而葡萄热休克转录因子家族中不存在A3、A5、A7和A9亚组的成员。
安徽农业科学2017年
2.2葡萄Hsf家族的特征
大部分的葡萄热休克转录因子基因含有1个内含子和2个外显子,而VIT_208s0007g03900没有内含子。VIT_211s0016g02010含有12个外显子和11个内含子。大部分葡萄热休克转录因子基因的内含子的相位是相位0,除了VIT_204s0008g01110含有1个相位1的内含子,VIT_204s0008g01110含有1个相位1的内含子,VIT_211s0016g02010含有3个相位1的内含子和3个相位2的内含子(图3)。整个葡萄热休克转录因子基因家族的49个外显子中只有2个对称外显子。过多的对称外显子会造成外显子的复制和重排[32-33]。通过分析葡萄热休克转录因子基因家族的基因结构,发现葡萄热休克转录因子基因结构相对比较稳定。
而蛋白二级结构分析显示,相对于疏水性的七肽重复序列,葡萄热休克转录因子家族的DNA绑定结构域相对保守(图4)。
采用The Multiple EM for Motif Elicitation(MEME)基序研究工具分析蛋白二级结构分析。在葡萄热休克转录因子家族中,发现了20个保守的基序(motif),大部分家族成员包含motif1和motif3。然而,D组的2个家族成员都不含有motif1和motif3。大部分B组成员含有特殊的motif4,而部分A组成员含有特殊的motif6,部分A组成员含有特殊的motif20(图5)。表2为葡萄热休克转录因子最保守的motif基序序列。
2.3葡萄Hsf家族的选择压力分析
利用Codeml program under PAML软件中的位点模型分析不同葡萄热休克转录因子亚家族在进化中所遭受的选择压力,探索是否不同亚家族遭遇不同的选择压力。选择压力(selective pressure),又称为进化压力,指外界施与一个生物进化过程的压力,从而改变该过程的前进方向。当该亚家族的Ka/Ks(ω)>1,说明该亚家族受到正向选择(positive selection);当该亚家族的Ka/Ks(ω)=1,说明该亚家族受到中性选择(neutral selection),当该亚家族的Ka/Ks(ω)<1,说明该亚家族受到纯化选择(purifying selection)。由于葡萄热休克转录因子的C组只包含1个基因,所有只分析A、B和D组在葡萄进化中所受到的选择压力。
结果显示,葡萄A组热休克转录因子在进化过程中遭遇了纯化选择(ω=0.69 069)。M1a与M2a比较分析发现了41个正向选择位点,其中包括1个显著(P<0.01)的正向选择位点 409 G[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了120个正向选择位点,其中包括2个显著(P<0.01)的正向选择位点400 - 和409 G[Bayes Empirical Bayes(BEB)analysis]。葡萄B组热休克转录因子在进化过程中遭遇了纯化选择(ω= 0.41 679)。M1a与M2a比较分析未发现正向选择位点[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了40个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。葡萄D组热休克转录因子在进化过程中遭遇了纯化选择(ω= 0.63 930)。M1a与M2a比较分析发现了68个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。M7与M8比较分析发现了68个正向选择位点,但未发现显著的正向选择位点[Bayes Empirical Bayes(BEB)analysis]。
2.4葡萄Hsf家族基因在不同非生物脅迫下的表达
利用前人研究的基因芯片表达谱数据,对在4 ℃低温胁迫处理1 h与4 h的葡萄茎中葡萄热休克转录因子基因的表达变化进行了分析,数据来源为plexdb数据库与NCBI数据库,GEO Accession为GSE31594(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE31594)。结果显示,在4 ℃低温胁迫处理1 h葡萄茎中,有9个(VIT_218s0001g10380、VIT_211s0016g02010、VIT_211s0016g03940、VIT_205s0020g04090、VIT_202s0025g04170、VIT_205s0029g00340、VIT_210s059 7g00050、VIT_204s0008g01110、VIT_210s0003g01770) 葡萄热休克转录因子基因上调2.0倍以上,其中8个(VIT_218s0001
2.5葡萄Hsf家族基因启动子的顺式作用元件
利用在线软件PLANTCARE分析了葡萄热休克转录因子家族基因的启动子序列(起始密码子上游1 500 bp),结果显示大部分的葡萄热休克转录因子家族基因的启动子含有顺式作用元件LTR(low temperature responsive),与低温诱导相关。大部分的葡萄热休克转录因子家族基因的启动子含有顺式作用元件MBS element(MYBbinding drought inducible),与MYB转录因子结合和干旱诱导相关。部分葡萄热休克转录因子家族基因的启动子含有顺式作用元件G-box,与bHLH转录因子结合相关。部分葡萄热休克转录因子家族基因的启动子含有顺式作用元件HSE,说明可能有的葡萄热休克转录因子基因的表达可能受热休克转录因子调控。
2.6相关性分析显示密码子使用偏好性可能受到的影响
利用软件CodonW1.4计算葡萄热休克转录因子家族各成员基因的密码子使用偏好性指数。通过指数发现,葡萄热休克转录因子家族各成员基因存在密码子使用的偏好性。很多葡萄热休克转录因子家族各成员基因,例如VIT_200s0179g001基因中,编码苯丙氨酸(Phe)的密码子UUU的RSCU值为1.30,而编码苯丙氨酸(Phe)的密码子UUC的RSCU值为0.70。这说明UUU是高频使用的密码子,更被偏好使用。
葡萄热休克转录因子家族外显子的平均GC含量为47.37%,平均GC3s为47.45%,平均Fop为0.40 825,平均CAI为0.20 450,平均CBI为-0.02 605。
为进一步揭示密码子使用偏好性,该研究分析了Fop、CAI、CBI与外显子数目、外显子GC含量、外显子GC3s的相关性。结果表明,Fop与GC含量呈显著正相关(r=0.70,P<0.01)(图8a);Fop与GC3s呈显著正相关(r=0.76,P<
0.01)(图8b);Fop与GC含量与GC3s相关性较强,表明葡萄热休克转录因子基因外显子密码子使用偏好性受突变压力(GC含量)影响;而Fop与外显子数目相关性不强(r=0.20,P<0.01)(图8c);CBI与GC含量呈显著正相关(r=0.71,P<0.01)(图8d);CBI与GC3s呈显著正相关(r=0.74,P<0.01)(图8e);CBI与GC含量与GC3s相关性较强,表明葡萄热休克转录因子基因密码子使用偏好性受突变压力(GC含量)影响;CBI与外显子数目相关性不强(r=0.17,P<0.01)(图8f);CAI与GC含量呈正相关,但相关性不强(r=0.28,P<0.01)(图8g);CAI与GC3s呈正相关(r=0.37,P<0.01)(图8h);CAI与外显子数目相关性不强(r=0.24,P<0.01)(图8i)。
3讨论
该研究从全基因组范围内鉴定葡萄热休克转录因子家族,共找出20个葡萄热休克转录因子家族成员。尽管利用拟南芥和葡萄热休克转录因子家族成员构建的进化树可以被分为4个大组,但是拟南芥热休克转录因子家族只含有A、B、C共3组的成员[4],而葡萄热休克转录因子家族可以被划分为A、B、C和D 4个大组。葡萄热休克转录因子的分组和拟南芥稍有不同。多重序列比对结果显示D组成员的主要结构域氨基酸序列与A、B、C组成员都略有差异。
葡萄热休克转录因子各成员的基因结构相似,大部分由2个外显子和1个内含子构成,结构较为单一。整个葡萄热休克转录因子基因家族的49个外显子中只有2个对称外显子。过多的对称外显子会造成外显子的复制和重排[32-33],说明葡萄热休克转录因子基因结构相对比较稳定。不同亚组成员的motif具有特异的保守基序,说明不同的亚组成员可能存在功能差异。尽管各个亚组所受到的选择压力都为纯化选择,说明同一亚组成员之间的功能差异可能不大,但是通過检测到的多个正向选择位点,说明同一亚组成员之间的功能也可能存在分歧或新功能的出现。
在不同非生物胁迫(高温和冷)处理下,不同葡萄热休克转录因子基因的表达发生显著变化,说明部分葡萄热休克转录因子可能涉及高温胁迫和低温胁迫的耐受。在不同非生物胁迫处理下,不同葡萄热休克转录因子基因表达量变化各有异同,也说明不同的葡萄热休克转录因子可能参与了不同胁迫的耐受,即功能可能存在差异。这些基因在不同胁迫下表现出的表达差异可能与启动子顺式调控元件的差异相关,例如有的葡萄热休克转录因子基因含有LTR元件,说明可能受到低温的直接诱导。而有的含有顺式调控元件,例如MBS、G-box,说明部分葡萄热休克转录因子基因的表达变化可能是受到其他转录因子的间接影响。
密码子使用偏好性研究显示,葡萄热休克转录因子家族各成员基因存在密码子使用的偏好性,而这种偏好性可能是受突变压力(GC含量)影响[34-35]。
4结论
该研究鉴定并分析了葡萄热休克转录因子家族,一些葡萄熱休克转录因子基因在非生物胁迫下的表达模式显示其在葡萄对环境压力的响应中起到了作用。该研究结果为深入研究葡萄热休克转录因子的功能提供了有用的信息。
参考文献
[1] ALWHAIBI M H.Plant heatshock proteins:A mini review[J].Journal of king saud universityscience,2011,23(2):139-150.
[2] QIAO X,LI M,LI L T,et al.Genomewide identification and comparative analysis of the heat shock transcription factor family in Chinese white pear(Pyrus bretschneideri)and five other Rosaceae species[J].BMC plant biology,2015,15(1):12. [3] WANG W X,VINOCUR B,SHOSEYOV O,et al.Role of plant heatshock proteins and molecular chaperones in the abiotic stress response[J].Trends in plant science,2004,9(5):244-252.
[4] GUO M,LIU J H,MA X,et al.The plant heat stress transcription factors (HSFs):Structure,regulation and function in response to abiotic stresses[J].Frontiers in plant science,2016,7:1-13.
[5] SCHARF K D,BERBERICH T,EBERSBERGER I,et al.The plant heat stress transcription factor(Hsf)family:Structure,function and evolution[J].Biochimica et biophysica acta,2012,1819(2):104-119.
[6] SCHWECHHEIMER C,BEVAN M.The regulation of transcription factor activity in plants[J].Trends in plant science,1998,3(98):378-383.
[7] KREPS J A,WU Y J,CHANG H S,et al.Transcriptome changes for Arabidopsis in response to salt,osmotic,and cold stress[J].Plant physiology,2002,130(4):2129-2141.
[8] SHINOZAKI K,YAMAGUCHISHINOZAKI K.Gene networks involved in drought stress response and tolerance[J].Journal of experimental botany,2007,58(2):221-227.
[9] WANG J,SUN N,DENG T,et al.Genomewide cloning,identification,classification and functional analysis of cotton heat shock transcription factors in cotton(Gossypium hirsutum)[J].BMC genomics,2014,15(1):961.
[10] HU Y,HAN Y T,WEI W,et al.Identification,isolation,and expression analysis of heat shock transcription factors in the diploid woodland strawberry Fragaria vesca[J].Frontiers in plant science,2015,6:736.
[11] VON KOSKULLD RING P,SCHARF K D,NOVER L.The diversity of plant heat stress transcription factors[J].Trends in plant science,2007,12(10):452-457.
[12] KOTAK S,LARKINDALE J,LEE U,et al.Complexity of the heat stress response in plants[J].Current opinion in plant biology,2007,10(3):310-316.
[13] SWINDELL W R,HUEBNER M,WEBER A P.Transcriptional profiling of Arabidopsis heat shock proteins and transcription factors reveals extensive overlap between heat and nonheat stress response pathways[J].BMC genomics,2007,8(1):125.
[14] LI P S,YU T F,HE G H,et al.Genomewide analysis of the Hsf family in soybean and functional identification of GmHsf34 involvement in drought and heat stresses[J].BMC genomics,2014,15(1):1009.
[15] DALTON T P,SOLIS W A,NEBERT D W,et al.Characterization of the MTF1 transcription factor from zebrafish and trout cells[J].Comparative biochemistry and physiology Part B:Biochemistry and molecular biology,2000,126(3):325-335.
[16] AKERFELT M,MORIMOTO R I,SISTONEN L.Heat shock factors:Integrators of cell stress,development and lifespan[J].Nature reviews molecular cell biology,2010,11(8):545-555. [17] YANG Z F,WANG Y F,GAO Y,et al.Adaptive evolution and divergent expression of heat stress transcription factors in grasses[J].BMC evolutionary biology,2014,14:147.
[18] JAEGER A M,PEMBLE IV C W,SISTONEN L,et al.Structures of HSF2 reveal mechanisms for differential regulation of human heat shock factors[J].Nature structural & molecular biology,2016,23(2):147-154.
[19] ALMOGUERA C,ROJAS A,DIAZMARTIN J,et al.A seedspecific heatshock transcription factor involved in developmental regulation during embryogenesis in sunflower[J].Journal of biological chemistry,2002,277(46):43866-43872.
[20] DIAZMARTN J,ALMOGUERA C,PRIETODAPENA P,et al.Functional interaction between two transcription factors involved in the developmental regulation of a small heat stress protein gene promoter[J].Plant physiology,2005,139(3):1483-1494.
[21]
KOTAK S,VIERLING E,BUMLEIN H,et al.A novel transcriptional cascade regulating expression of heat stress proteins during seed development of Arabidopsis[J].The plant cell,2007,19(1):182-195.
[22] PETERANDERL R,RABENSTEIN M,SHIN Y K,et al.Biochemical and biophysical characterization of the trimerization domain from the heat shock transcription factor[J].Biochemistry,1999,38(12):3559-3569.
[23] NOVER L,BHARTI K,DRING P,et al.Arabidopsis and the heat stress transcription factor world:How many heat stress transcription factors do we need?[J].Cell stress & chaperones,2001,6(3):177-189.
[24] BANIWAL S K,BHARTI K,CHAN K Y,et al.Heat stress response in plants:A complex game with chaperones and more than twenty heat stress transcription factors[J].Journal of biosciences,2004,29(4):471-487.
[25] LIN Y X,CHENG Y,JIN J,et al.Genome duplication and gene loss affect the evolution of heat shock transcription factor genes in legumes[J].Plos one,2014,9(7):1-18.
[26] SORGER P K,PELHAM H R.Yeast heat shock factor is an essential DNAbinding protein that exhibits temperaturedependent phosphorylation[J].Cell,1988,54(6):855-864.
[27] DRING P,TREUTER E,KISTNER C,et al.The role of AHA motifs in the activator function of tomato heat stress transcription factors HsfA1 and HsfA2[J].The plant cell,2000,12(2):265-278.
[28] HSU A L,MURPHY C T,KENYON C.Regulation of aging and agerelated disease by DAF16 and heatshock factor[J].Science,2003,300(5622):1142-1145.
[29] MAERE S,DE BODT S,RAES J,et al.Modeling gene and genome duplications in eukaryotes[J].Proceedings of the national academy of sciences of the USA,2005,102(15):5454-5459.
[30] YANG Z H.PAML 4:Phylogenetic analysis by maximum likelihood[J].Molecular biology and evolution,2007 24(8):1586-1591.
[31] YANG Z H,NIELSEN R,GOLDMAN N,et al.Codonsubstitution models for heterogeneous selection pressure at amino acid sites[J].Genetics,2000,155(1):431-449.
[32] GILBERT W.The exon theory of genes[J].Cold spring harbor symposia on quantitative biology,1987,52(52):901-905.
[33] PATTHY L.Introndependent evolution:Preferred types of exons and introns[J].Febs letters,1987,214(1):1-7.
[34] CHEN S L,LEE W,HOTTES A K,et al.Codon usage between genomes is constrained by genomewide mutational processes[J].Proceedings of the national academy of sciences of the USA,2004,101(10):3480-3485.
[35] KNIGHT R D,FREELAND S J,LANDWEBER L F.A simple model based on mutation and selection explains trends in codon and aminoacid usage and GC composition within and across genomes[J].Genome Biology,2001,2(4):1-13.