论文部分内容阅读
真核基因的表达调控是非常复杂的,涉及到许多具有调控功能的核酸序列和蛋白质调控因子。例如,可变剪接过程的顺利完成受很多RNA模体和蛋白因子的调控。真核生物中可变启动子现象的存在,使基因转录调控机制变得更加复杂。核小体定位、甲基修饰、组蛋白修饰等表观遗传信息可能影响着可变启动子的选择。研究启动子的结构和功能,对理解基因转录调控机制和疾病研究具有重要意义。转录因子和剪接因子是基因表达调控中的重要调控蛋白。转录因子通过识别启动子开启基因的转录,剪接因子影响pre-mRNA的剪接。转录与剪接过程是相互耦合的,转录因子和剪接因子怎样发生耦合仍不清楚。系统分析人类启动子序列特征,构建人类转录因子与剪接因子的互作网络,是阐明基因转录调控机制和表达模式的重要环节,对相关人类疾病的研究也具有重要意义。从DBTSS数据库中获取人类启动子信息,并将启动子分为可变启动子与组成型启动子。基于GC含量、碱基二联体频率、DNA信息量、DNA变形能、核小体占据率、甲基化修饰程度、组蛋白修饰等指标统计,分析可变启动子与组成型启动子序列特征。分析GC含量和碱基二联体频率时,以小鼠、斑马鱼和红藻做为对照。基于SpliceAid F、CHTF、HPRD、Biogrid、DIP、Intact、HINT数据库,构建了转录因子和剪接因子的互作网络,使用连通度、聚类系数、中心度等指标对互作网络进行分析;统计了与剪接因子或其他蛋白相连通的转录因子的个数;定义蛋白互作相对倾向性因子对蛋白之间互作倾向进行评价。对四种真核生物启动子的序列分析显示:在人类、小鼠、斑马鱼和红藻基因组中,可变启动子GC含量高于组成型启动子;可变启动子和组成型启动子的二联体频率没有明显差异;人类和小鼠的启动子在序列上有着更多的相似性,使用的可变启动子更为复杂。人类启动子系统分析显示:组成型启动子和可变启动子的DNA信息量没有明显差异,二者的碱基分布都具有规律性,碱基二联体的出现具有关联性;在常染色体上,可变启动子的DNA变形能和核小体占据率高于组成型启动子,且转录起始位点附近的DNA变形能和核小体占据率较低,而性染色体上无此规律;复杂的多启动子和性染色体的甲基化修饰程度较低,组成型启动子和可变启动子的甲基化修饰程度没有明显区别,但二者的组蛋白修饰有区别。转录因子和剪接因子互作网络的研究显示:转录因子与剪接因子以相互间隔1、2、3个蛋白为主的方式相互耦合;瓶颈蛋白占直接连接转录因子和剪接因子蛋白质的20%;转录因子与剪接因子的内部互作倾向性强于二者之间的互作倾向性。