论文部分内容阅读
基因重复是产生新基因的主要方式,为物种进化提供基本的遗传物质。特别是,基因组重复可以产生大量的重复基因。所有的被子植物中都发生过基因组重复,例如模式植物拟南芥从种子植物起源至今至少发生过5次基因组重复。基因组重复对真核生物进化影响重大,对一些类群的新性状的获得有着重要的贡献。通过研究一些关键基因家族的进化和表达,将有助于理解生物进化过程中一些关键性状的进化。虽然动植物的发育过程非常不同,但是二者在表观遗传调控机制方面却相对保守,如组蛋白的修饰。其中重要的组蛋白修饰之一是赖氨酸甲基化,其通过影响染色质的结构调节基因的表达,从而影响生长发育和生理生化等过程。SET蛋白是主要的赖氨酸甲基转移酶,包含一个保守的SET结构域,具有甲基转移酶活性。为了深入了解组蛋白甲基化系统的演化,本研究利用比较基因组学和系统发生学手段,分析了动植物中的SET结构域基因的进化历史。根据人和拟南芥中的SET结构域基因系统发生树,SET结构域基因家族可分成7个亚家族(Suv、Ash、Trx、E(z)、SMYD、SETD和PRDM)。Suv、Ash、Trx和E(z)在动植物中高度保守,先前研究已报道。SMYD和SETD分化显著,在系统树上的支持度很低,但分别含有保守的结构域模式。不同亚家族中的蛋白具有不同的结构域模式,每个亚家族具有相对保守的结构域模式。在Suv、Ash和Trx中,一些SET结构域蛋白随着物种分化,结构域组成发生了丢失或获得,表明SET结构域蛋白与其它蛋白相互作用关系在进化过程中发生分化。通过系统发生树,SET结构域基因在动植物中被分成31和33个直系同源群,其中大部分分别包含无脊椎动物成员或绿藻,表明其可能起源于动物或绿色植物早期,并且功能保守。Suv、Ash、Trx和E(z)亚家族分别在脊椎动物中和陆生植物中包含很多重复基因对,暗示这些保守亚家族发生了分化。这4个亚家族在脊椎动物和无脊椎动物分化后,在脊椎动物中发生了扩张;陆生植物与绿藻分化后,在陆生植物中发生扩张。根据基因组共线性证据,显示脊椎动物和被子植物中的扩张是由于基因组重复导致的。已有研究表明拟南芥中一对SET结构域重复基因,MEA与SWN发生了快速进化或正选择,通过分析拟南芥中其它SET结构域重复基因,发现ASHH3与ASHH4具有类似于MEA与SWN的现象,共线性证据显示其是在十字花科的基因组重复中保留下来的。进一步使用PAML和Branch-site REL分支模型分析显示ASHH3/ASHH4重复之后,ASHH4发生快速进化或正选择,由此可能产生了新功能;而ASHH3则受到强烈的负选择,可能维持祖先的功能。综上所述,SET结构域基因家族的进化历史显示基因组重复或者其它机制对表观遗传的复杂性有着极大的贡献,加深了对表观遗传的认识。转录调控在花发育中具有重要作用,而过去花发育期间的转录组分析主要采用芯片分析,未能包含所有基因。使用RNA-Seq技术对拟南芥花的转录组进行了检测,样本包括aplcal突变体的生殖分生组织,花的1-9期,花的第12期。这三个样本中检测到了24542个表达的基因,其中有8000多个基因为常用的Affymetrix芯片上没有的。这些基因中,大部分表达量较低,且与环境和应激密切相关,其中一些属于转录因子家族,如NAC、bHLH、AP2和MYB等。与其它组织比较,发现大量基因倾向于在花发育过程中表达较高,这些基因中富集着与ATP酶、染色质修饰和RNA合成相关基因家族,如AAA、WD40、SET、 Helicase_C和DEAD等基因家族。此外,通过对不同转录组样本的比较,发现未知功能的(DUF)基因家族的表达具有时空特异性,比如DUF577在减数分裂细胞中特异表达,而DUF1216在花发育的1-9期特异表达。