论文部分内容阅读
在各种生物学过程中,基因的表达呈现错综复杂的时空特异性,转录调控对这些过程中基因的差异表达起着核心作用。基因表达的调控发生在三个相互整合的层次中。第一个层次发生在序列水平上,是指承担一定功能的序列在基因组内一维结构的组织顺序。这一水平涉及所有的编码区、各种能结合序列特异性蛋白质因子的调控序列以及决定染色质纤维三维折叠形态的序列元件。第二个层次在染色质水平上,指不同染色质功能状态之间的切换。抑制转录和允许基因活化这两种状态之间的切换可能发生在基因簇的水平,包括由组蛋白修饰、DNA甲基化以及由多种抑制与活化机制相互作用所控制的一系列染色质结构的改变。第三个是核水平,是基因组在细胞核内部三维空间的动态组织、细胞核结构与功能的区室化。
为了进一步理解顺式调控模体的组织与功能之间的关系,本文从一般的顺式调控模体中区别出两种特殊类型。第一种类型为重复位点簇(ReSC),当一个调控序列中多次出现同一个或称同质的转录因子的结合位点时,定义为重复位点簇。重复位点簇是已知的通过单个转录因子的局部浓度调控转录活性的模式。另一种类型为组合元件(CE),由两个紧密相邻的转录因子的结合位点形成最小的功能单元,发挥组合的调控作用。本文接着分析了转录调控数据库TRANSFAC6.0和TRANSCompel6.0中的已知转录因子结合位点,调查了顺式调控模体的统计学特征。通过预测人、小鼠、大鼠全基因组中基因上游5kb序列中的转录因子结合位点,本文观察到两组中结合位点偏好性相反的转录因子,一组倾向于结合启动子附近的序列,另一组的结合位点远离启动子区。本文构建了人、小鼠和大鼠转录分析的生物信息学体系。为了提高预测的准确性,本文整合了多种生物学数据,包括基因表达谱、基因本体论(GO)分类和已知的生物通路的数据,构建了在线工具Co-Trans,便于观察和分析转录因子结合位点和顺式调控模体。