论文部分内容阅读
基因调控网络旨在研究不同基因之间的调控关系,是细胞维持基本功能和响应外界刺激的基本单元。随着表观遗传层面调控机制的研究进展,已经产生出大量实验手段(代表性的有DNase-seq,ATAC-seq,FAIRE-seq)可在全基因组范围内测量染色质的开放状态。尤其是人类基因组计划之后的“DNA元件百科全书”计划(Encyclonpedia of DNAelements,简称ENCODE)和表观组学路线图计划(Roadmap Epigenomics Mapping Consortium,简称ROADMAP)的开展,极大地推动了数据的积累,人们对染色质具有“开放”和“关闭”两种状态的认识得以加深。处于“关闭”状态的染色质,在异染色质蛋白以及修饰酶的作用下,被包装成致密、紧凑的结构,阻遏转录因子等蛋白的结合,处于沉默失去生物功能的阶段;而处于“开放”状态的染色质,具有不太紧致的结构,可招募转录因子等蛋白的结合,进而调控基因的表达水平,例如位于非编码区域的调控元件如增强子(enhancer)只有处于“开放”状态才有可能参与对其目标基因调控作用。基于此,本论文研究了考虑染色质开放状态因素的转录调控建模,推导了基于微分方程的转录调控的热力学模型,对染色质开放状态因素对转录速率的影响进行了定量分析,并在新的模型下研究了调控网络的推断问题。本论文取得的主要结果为: (1)推导出了考虑染色质开放状态的基因转录速率热力学模型。基于经典的基因调控网络的微分方程模型,假设染色质开放状态的不同会导致转录因子结合DNA序列的能量的不同,在统计热力学的框架下将问题表述为一个有约束的最优化模型,通过最优性条件得到基因转录速率作为蛋白质浓度和调控元件的开放状态的函数形式。 (2)定量分析了染色质开放状态对转录速率的影响。基于扩展的基因转录速率热力学方程,考察了蛋白浓度和启动子、增强子的开放状态对转录速率的定量影响。我们发现,当基因启动子状态由关闭逐渐变为开放时,该基因的转录速率一般都会有明显的提升,提升的幅度与启动子处特异性绑定对应的能量差有关。而增强子等功能元件的开放状态则既可以起促进作用,也可以起到抑制作用,取决于元件对转录速率的调控强度。 (3)给出了考虑染色质开放状态的基因调控网络推断模型。考虑从染色质状态和表达的时间序列数据推断基因调控网络结构,根据样本量的大小,分别给出了三种情况下的网络推断模型。特别在参数个数和样本量一致时,生成了一组模拟数据,在三个基因的调控网络上进行了数值试验,发现引入染色质开放状态因素可以降低网络推断的假阳性率。