论文部分内容阅读
随着基因调控在生物医学研究的深化发展,基因表达、转录、翻译等相关研究也引起了数学、统计、计算机、物理、化学等领域的学者和专家越来越多的热切关注,更成为了现代分子生物学中的重要热门课题。基因表达的中心法则:DNA指导RNA的生成,RNA指导蛋白质的生成,主要包括转录和翻译两个步骤,每一个步骤都包含大量的生化反应,跨越多个时间尺度。基因转录是所有生命的核心,是基因表达的第一阶段,因此阐明转录的分子机制及其调控原理十分重要。本文讨论的问题由实验数据驱动,通过建立和分析两路径模型,研究多条信号诱导路径对基因转录的调控,以及同一基因的mRNA分子拷贝数在单细胞的质量分布。具体内容如下:第一章为绪论,概述基因转录的历史背景、转录机制、研究进展和预备知识,并说明本文的主要研究内容。理解单细胞中的基因应答环境变化作出调控一直是一个核心问题。最近的生物医学实验已经产生了关于表达动力学和噪声的大量数据。为了使理论与实验数据良好拟合,在基因表达模型中,常常需要调节基因的激活率和失活率,mRNA的合成率等。在经典的两状态模型中,活性的mRNA和蛋白质以脉冲式爆发和合成行为被认为由在基因开启和基因闭合随机切换形成的,意味着在环境变化下,一条路径指导基因激活。在第二、三章中,我们建立交互式路径模型,在经典的两状态模型中引入一条通常被忽视的弱基础路径,它与信号路径竞争来激活基因。我们揭示了两条路径间的丰富的调控规律,并与实验数据很好地吻合,可能为未来的生物物理研究开辟一条新的途径。第二章,我们尝试揭示了丰富的基因表达的交互式路径调控模式。Hao和Baltimore在2009年研究mRNA的稳定性影响炎症分子基因诱导的时间顺序中,对培养的小鼠成纤维细胞在进行细胞肿瘤坏死因子(TNF)刺激后的基因表达进行了定量分析,并将180个激活的基因按mRNA积累水平的峰值和对应时间分为三组动态类别。我们对上述三组代表性数据进行了理论拟合,特别发现,平均表达水平剧烈的先增后减的动态可以通过一条被频繁选择的、可以将表达水平迅速上调到高水平的强信号路径,以及一条很少被选择的、表达水平从峰值下调到基线的弱基础路径来实现。有趣的是,这种负调控从mRNA水平到蛋白质水平的转变完全依赖于蛋白质的稳定性和一个由交互式路径调控的阈值。为了更明确地说明这种先增后减非单调的表达模式,我们假设基因失活率大于mRNA降解率。我们推导了信号路径的选择概率的一个阈值。当选择概率小于等于阈值时,平均表达水平显示单调增加模式,但是在选择概率大于等于阈值时,平均表达水平切换到先增后减的模式。此外,我们还和单路径模型进行了比较,单路径模型对实验中同样的数据进行拟合时,只会产生单调递增模式。这一观察结果表明,自然选择可能有利于交互式路径调控,从而诱导信号路径实现两个相互制约的要求:基因表达的快速上调有助于对外部急性压力的适应;随后的抑制,以避免过度旺盛的表达可能产生有害的副作用。我们的理论结果和实验观察证实,交互路径模型中,稳定表达产物(mRNA和蛋白)通常对应于单调生长表达模式,不稳定表达产物更有可能呈现平均水平的非单调模式。最后,我们对模型进行了数学分析,分别得到了mRNA和蛋白质平均水平8)()和(6()的解析表达式,并分析了他们的特征。根据8)()和(6()的相关性,进一步讨论了它们的动力学行为。第三章,我们揭示了一个通用的交互路径的调控方案,可以解释在变化的环境下,不同启动子的稳态数据的表达。通过改变信号通路的选择概率2或者信号路径的感应强度2来生成噪声和fano因子(噪声强度)相对均值表达的几条不同的曲线。这些理论结果与在大肠杆菌、酵母和哺乳动物细胞中的采集到的大量数据可以很好地拟合。结果表明:2是应答对外部信号变化时的主要特征,并且2在不同的染色质环境中被显著调控。为了更深入地了解2和2在基因调控中的关键作用,我们重点分析了三类大肠杆菌启动子和HIV LTR启动子的转录数据,以及将数据设置为2和2对均值表达的变化。这揭示了一种鲁棒的调控模式:2在表达较低时被调控,2在表达较高时被调控。这种有序的调控表明,信号诱导的TFs(转录因子)的积累主要是通过更强的信号路径来更频繁地引导基因激活。一旦TFs的浓度和保留时间达到最高值,则方案转换为增加信号路径的感应强度,如增强受染色质结构阻碍的DNA结合位点的可达性。我们进一步令两状态模型对同一组稳态数据集进行拟合,发现两种不同的结论。首先,使用两状态模型拟合来自不同启动子的数据需要改变mRNA合成率、基因激活率和失活率形成不同的调控模式。这意味着应答环境变化的基因调控具有启动子特异性,因为它可能只作用于某些独立的基因。另一方面,通过交互式路径模型对同组数据进行理论拟合,仅通过调节基因激活过程中的信号通路就可以很好地实现。这表明启动子的特异性调控可能由启动子的结构决定;启动子的非特异性调节,反映了对调控元件在相应DNA结合位点的结合和不接和等全局的约束。此外,我们得到了稳定状态下交互式信号路径模型的平均水平、噪声和fano因子的解析形式,以及对模型的参数进行了分析。第四章,我们开展了一个关于随机转录模型的mRNA分布的动力学的理论研究,该模型包含了应对外部信号直接激活基因的交叉信号路径。我们首先给出了转录在中度和高度上调的情况下mRNA分布的数学动力学公式。在每一种情况下,我们进一步的数字模拟展示了酵母细胞在生存压力下基因的三种分布模式中观察到的一种动态转录。特别的,中间的双峰期在早期一定的时间内维持着,时间比单路径产生的双峰期要长。这表明了受交叉信号路径调控的双峰转录的一般性和鲁棒性。第五章我们对全文进行了简要的归纳总结,并对今后的科研工作进行了展望。未来的工作中,我们考虑在现有的模型中加入细胞分裂、基因复制等生物学过程,研究它们的动力学行为和概率分布函数。同时在现有模型的基础上,研究免疫系统抗菌肽基因的多路径调控。