论文部分内容阅读
人类基因组计划完成后,获得了海量的DNA序列数据,基于这些数据人们在基因表达方面开展大量的研究工作。漫长的研究过程使我们逐步认识到,基因组DNA的表达调控非常复杂。相关研究结果显示,除了DNA序列自身以外,还有其它的可遗传的生物学因素影响基因表达,这类作用被称为表观遗传调控,至此表观遗传学应运而生。这些遗传调控信息主要集中在几大方面:组蛋白修饰、核小体定位、染色质重塑、DNA甲基化修饰以及非编码RNA调控等。而目这些因素能够相互作用,共同决定复杂的生命过程。
组蛋白修饰是表观遗传调控信息的一个重要研究内容。组蛋白修饰是在相关修饰酶的作用下发生在核小体组蛋白N末端的共价修饰,这些共价修饰包括甲基化、乙酰化和磷酸化等。不同的组蛋白修饰在基因的表达中起着不同的作用,包括组蛋白密码、信号网络和电荷中和等不同的模型被提出来说明组蛋白修饰的功能。2000年,Strahl和Allis提出“组蛋白密码”假设。该假设认为单一组蛋白的修饰往往不能独立地发挥作用,一个或多个组蛋白尾部的不同共价修饰依次发挥作用或组合在-起,形成一个修饰的级联,它们通过协同或拮抗来共同发挥作用,影响基因的表达。组蛋白密码被提出后,组蛋白修饰组合模式成为基因表达调节研究领域的热点。
基于组蛋白密码思想,本文研究了酿酒酵母组蛋白修饰的组合模式,同时提出了组蛋白修饰作用关系模型,并从相关修饰酶角度对修饰因果组合关系机理进行了分子生物学水平的探讨。主要研究内容如下:
1.在得到酿酒酵母组蛋白修饰数据和确定转录起始位点(TSS)的基础上,一方面为了了解12种组蛋白修饰围绕转录起始位点修饰水平的变化趋势;另一方面为了校验筛选后的组蛋白修饰数据的准确性,因此研究了组蛋白修饰在启动区和编码区的修饰分布模式。一些经典修饰(比如H3K4me3、H3K4me2和H3K4mel)的分布模式结果显示,筛选的数据是准确的。所有的组蛋白修饰水平都围绕TSS有非常明显的变化,几乎在TSS位点修饰水平都最低,而在TSS两侧区域修饰水平逐渐增强。在接近编码区末端时,修饰的水平又逐渐降低。
2.为了分析构建的组蛋白修饰网络,我们首先研究了TSS+1kb区域12种组蛋白修饰的相关性。另外,针对研究较多的TSS-1kb区域,我们也进行了修饰的Pearson相关分析。结果显示,12种组蛋白修饰在两个区域根据相关系数都被分成两个强相关群体。一个群体是转录增强修饰群体(群体A),另一个群体是转录抑制或转录无关联修饰群体(群体B)。群体A包括7种修饰(H2AK7Ac、H3K14Ac、H3K9Ac、H4K5Ac、H3K18Ac、H4K12Ac和H3K4Me3);群体B包括5种修饰(H3K4Me1、H2BK16Ac、H3K4Me2、H4K16Ac和H4K8Ac)。基于转录水平的修饰聚类结果与Pearson相关分析一致。
3.一些组蛋白修饰酶能够通过自身蛋白的结构域与另一些修饰结合。因此,这些酶催化的组蛋白修饰与结合位点修饰之间建立了因果关联关系,在此因果关系的基础上两种修饰形成修饰组合。依据以上思路,本课题以贝叶斯网络为手段研究了组蛋白修饰组合模式。贝叶斯网络能够显示一种修饰组合模式的多个修饰之间的因果关系。针对本研究的12种组蛋白修饰确定了23种组合模式。通常情况下,在-个组合模式内的几种修饰关联较强,处于一个关联群体。另外,从组蛋白修饰酶的分子结构水平分析了部分组蛋白修饰组合。
4.为了了解组蛋白修饰因果关系在转录水平不同情况下的差异,在逐步删除低转录基因和高转录基因的基础上,构建了高转录贝叶斯网络和低转录贝叶斯网络。在比较和分析了两个网络后,发现高转录基因的贝叶斯网络显示的修饰关系更加稳定、有较少的变化,表明更多的修饰组合在基因转录水平高的时候发挥生物学作用。四组修饰组合(H2BK16Ac→H3K4Me3、H3K14Ac→H3K4Me3、H4K12Ac→H3K18Ac和H2AK7Ac→H3K14Ac)在基因转录的过程中始终发挥作用,它们的功能不依赖于基因的转录水平,这些修饰组合对于基因转录是必需的。此外,基于两个网络的稳定路径(修饰组合关系),提出了组蛋白修饰作用关系模型。该模型认为,两个网络的终端修饰的“打开”和“关闭”是彼此互斥的;因为修饰之间存在因果关系,所以位于网络上层的修饰之间的因果关系对于下层网络修饰之间的关系是有影响的,同时这种影响会对终端修饰与PolⅡ之间的关系发挥作用,文中进一步分析了网络上层修饰间因果作用关系如何对下层修饰产生影响这一过程。