论文部分内容阅读
基因的表达调控是许多生物学过程正常有序进行的基础。在转录水平上,作用于基因表达的主要调控因子包括转录因子及表观修饰。转录因子与顺式作用元件中特定的DNA序列结合,从而激活或者抑制基因的转录。表观修饰可通过改变局部染色体结构调控转录因子和顺式作用元件的结合,进而控制基因的表达。因此转录因子结合位点及其周围的表观修饰模式可用于判断其调控活性。随着高通量测序技术的快速发展和广泛应用,积累了大量的转录因子结合位点数据和表观修饰数据。结合位点数据以不同的形式储存在各转录因子结合位点数据库。研究表明,转录因子的结合受表观修饰的调控。植物中虽已报道了大量的相关转录因子结合位点的数据库,如PlantTFDB数据库,但这些数据库对转录因子结合位点研究的侧重点不同,且并未涉及有关转录因子结合位点表观修饰状态及其相关功能的报道。尽管之前有关于转录因子与表观修饰关联分析的报道,但仅限于几个细胞系中的个别转录因子或表观修饰的研究。因此创建一个整合转录因子结合位点及其表观修饰状态的数据库,有助于为相关研究领域提供专业的数据支持。本研究首先从PlantTFDB、JASPAR、Cis-BP和PlantCistromeDB四个数据库中下载了拟南芥、水稻和玉米的转录因子结合位点数据,并通过生物信息学方法对全基因上的转录因子核心基序进行识别。其次,整合了 NCBI等公共数据平台上三个物种的表观修饰数据。使用ChromHMM分别对三个物种的全基因组染色质状态进行识别,将拟南芥、水稻和玉米基因组分别划分成27种、13种、10种染色质状态,并以表观修饰为特征利用k-means算法对转录因子结合位点进行了聚类。通过转录因子结合位点周围的表观修饰模式可预测其功能,推测富集如H3K4me3、H3K9ac等具有转录激活作用的表观修饰的转录因子结合位点可促进基因的表达,富集如H3K27me3、DNA甲基化等具有转录抑制作用的表观修饰的转录因子结合位点可抑制基因的表达。为了更好的说明表观修饰与转录因子的关系,本研究还整合了表观修饰对应时期的RNA-seq数据。最后,为方便检索及后续分析,将相关结果添加到植物转录因子结合位点及表观修饰数据库 petfDB,用户可通过 http://bioinfo.njau.edu.cn/petfdb/index.php 访问。该数据库整合了拟南芥、水稻和玉米三个物种的转录因子结合位点、染色质状态图谱及结合位点与表观修饰关联分析等信息。另外,该数据库将JBrowser基因组浏览器作为可视化工具展现转录因子数据、表观修饰数据及RNA-seq数据。且用户可输入感兴趣的蛋白序列或DNA序列进行比对分析,查看其可能的结合位点及结合位点附近的表观修饰模式。利用该数据库还可以推测转录因子结合位点的功能及转录因子之间是否存在共定位等。本文通过对转录因子结合位点及表观修饰数据的整合,可以较全面的阐述转录因子及表观修饰的关系,为之后转录因子的深入研究奠定基础。