论文部分内容阅读
转录因子几乎涉及到生命活动的各个方面。哺乳类基因组中大约有1,500个转录因子。根据DNA结合域,可以把转录因子分成不同家族,每一类结合不同的DNA序列。转录因子对调控区域的识别在响应环境信号中起到关键作用。细胞和组织的特异性是由基因的时空差异表达所决定的,而调控基因表达的正是转录因子。这个调控的过程主要由DNA结合的转录因子与基因的启动子相互作用,进而实现基因表达的促进或抑制。转录因子在组织器官的发育、维持和行使正常功能等各个方面起到决定性作用。随着大规模测序和基因组学的兴起,对于哺乳动物的转录因子研究,科学家也已经开展了一大批高精度和深度覆盖的基因组转录组的研究。例如,使用RNA测序联合基因组启动子分析,研究转录因子mRNA的表达水平和变化。染色质免疫沉淀(ChIP)结合高通量方式,例如微阵列或测序技术,是另一种有效的方式用以研究基因组规模中的转录因子结合位点。通过开发一系列强大的数据分析工具和数据深度挖掘,mRNA水平上的转录因子结合位点研究和表达谱已经构建完成。上述研究均基于转录因子mRNA和ChIP-seq数据来构建转录调控模型。但是,这些研究仍然存在许多不足。首先,mRNA和蛋白表达量之间的相关性并不高,因此以mRNA的表达量推测蛋白质的表达水平精度不高。另外,由于试剂与通量的限制,ChIP-seq每次只能检测出某一特定转录因子的结合位点,所以只能获得有限转录因子的表达信息。从目前来看,由于转录因子在细胞中的丰度较低,鉴定转录因子并在蛋白质组的层面上研究其活性,仍然面临挑战。因此,实现在不同组织器官中,鉴定定量转录因子蛋白表达水平,及其DNA结合活性,是目前的主要研究方向。近年来,蛋白质组学研究技术,尤其是质谱的飞速发展,为检测整个蛋白质组提供了可能。本世纪初,“鸟枪法”蛋白质组逐渐兴起,大大提高了蛋白质组学的鉴定能力,自此,复杂蛋白质组学研究方兴未艾。2014年发表在Nature上的两篇文章,首次绘制出了人类蛋白质组草图,使我们对于生命科学的认知又向前迈进了一大步。转录因子这一特定的蛋白质群体,作为信号转导最终的执行调控者,其研究具有特殊的、不可替代的意义。然而,由于其丰度较低,难于检测及定量,因此在蛋白质组的水平上研究还相对缺乏。为了实现这一目标,我们实验室最近开发了一种可以在蛋白质组水平上,鉴定和评估转录因子DNA结合活性的方法。使用人工合成的一段包含多个串联转录因子结合序列的DNA片段(catTFRE)作为亲和试剂,在生理条件下,能有效地富集细胞核内有DNA结合活性的转录因子。结合大规模质谱定性定量分析技术,对转录因子亚蛋白质组的研究,可以达到和mRNA-seq同等的水平。在本研究中,我们采用开发的串联多拷贝转录因子结合序列DNA阵列(catTFRE)的方法,在蛋白质组规模上分析了24个成年和8个小鼠胎儿组织中激活的转录因子。本研究共定量鉴定了941个转录因子,覆盖了小鼠基因组中超过60%的转录因子。通过整合多组学的方法,我们在小鼠的主要组织器官中,揭示了其中主要的转录因子的活性表达情况,发掘和阐明了转录因子在各种不同组织器官中的作用,包括维持组织器官生理功能与代表多种生理系统的特征转录因子。本研究证明了,使用catTFRE富集,联用蛋白质组学检测,在组织器官层面,同样具有非常高的转录因子富集效率,并且能够十分有效地鉴定到对于组织和器官行使正常功能所必须的转录因子。我们鉴定到的转录因子,涵盖了现有所有转录因子家族。根据转录因子在各个组织器官中的表达活性,我们将这些转录因子分为普遍性转录因子和特异性表达的转录因子。随后我们以核蛋白受体家族转录因子为例,分析了转录因子家族在各个器官中的表达情况,证实通过系统生物学的研究方式,除了能够在单一细胞类型,特定组织类型中,也能够在生物体整体的尺度上,以组织和器官水平的分辨率,揭示某种或某些蛋白的生理功能。并且与使用mRNA数据的研究进行了对比,修正了其中一些由转录组自身缺陷而导致的异常结论。我们构建了转录因子共表达图谱,并利用共表达预测未知转录因子功能。共发现和筛选出了37个转录因子共表达模块。在一些特定的共表达模块中,我们能够预测其中某些转录因子的功能。例如,转录因子Zfp655与Hnf1a、Hnf1b、Hnf4a和Nr1h4紧密共表达,很可能在肝功能中发挥重要的作用,之后通过mRNA数据和GSEA的功能分析,进一步增强了这个可能性。转录因子往往相互作用以调节基因转录。我们通过在不同组织中使用内源性转录因子表达数据,可以验证来自酵母中人工过表达系统的转录因子之间的这些组合相互作用,如果它们不在相同组织中共表达,则可以排除两个转录因子之间的相互作用。我们发现,具有高特异性的转录因子往往具有较少的相互作用,而普遍性的转录因子具有更多的相互作用。这些观察结果表明,普遍性转录因子与不同的特异性转录因子相互作用,以扩展其调节能力并在不同组织中执行调节功能。转录因子亚蛋白质组是形成组织蛋白质组的驱动力。我们通过结合转录因子活性图谱和对应的组织器官mRNA数据,利用转录因子与其调控的靶基因之间的关系,确定了组织维持性转录因子(ttmTF)。ttmTF在维持组织特性方面至关重要。其靶基因,特别是受多个ttmTFs共同调控的靶基因,直接指示了组织功能。本研究中鉴定的ttmTF涵盖了大部分已知的关键TF,这些TF对于从成纤维细胞向组织的主要细胞类型的直接组织/细胞类型转化是必需的。我们通过肝切除再生模型,探究了组织在受到扰动和本身剧变时,转录因子的动态变化。我们根据转录因子在此过程中的时序变化,将肝再生的过程分为四个阶段,即启动阶段(0-12小时),早期进展(24-48小时),晚期进展(48小时-3天)和终止(5-7天),其中的转录因子分别对应免疫和刺激反应、发育和分化过程、核受体和新陈代谢、抑制信号和阻遏信号等功能。我们发现,当组织剧烈变化时,ttmTF这类转录因子往往会下调,表明当发生剧烈扰动时,肝细胞失去了它们的稳态和同一性或启动了去分化程序。除了使用模式动物小鼠来系统性的研究转录因子蛋白质组学,我们还对人类癌症细胞系NCI60进行了类似的研究。在59种癌症细胞系中,共鉴定到了849个转录因子,平均每种细胞系380个,整个转录因子的定量范围大约在6个数量级左右。我们根据每种细胞转录因子的表达活性谱图,来研究这些细胞的分子特征分类。令人惊讶的是,根据转录因子的表达情况,使用无监督层次聚类的方式,基本上每种组织来源的细胞系均能自发的聚集到一类中。这些结果意味着转录因子在对于细胞功能和特征的调控上层级更高,并且维持组织“身份”这一功能,也主要由转录因子的活性调控来保证。为揭示与药物敏感性和耐药性显着相关的转录因子特征,我们采用了弹性网回归分析,揭示了NCI60细胞系中,转录因子表达状态与抗肿瘤药物敏感性的相关关系。我们的数据表明,转录因子在癌症细胞中的表达情况,可以用于预测细胞对药物敏感性或者耐药性的一个生物指标,为之后的基础研究或者临床应用提供有效的支持。总之,我们的研究在小鼠组织和癌细胞系中构建了转录因子DNA结合活性的图谱,从而扩大了基于蛋白质组大规模转录因子研究的现有知识。转录因子表达模式将影响我们对转录因子如何在组织中执行其调节功能的理解。并且,通过对癌细胞系转录因子的研究,对鉴定癌细胞逃避有效的靶向抑制剂或化学治疗化合物的机制提供了新的思路。