人类基因组转录因子CTCF细胞特异性结合位点的预测

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:blueskyjava
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CCCTC结合因子(CTCF)是脊椎动物中广泛表达的一种蛋白质,在全基因组的Ch IP-seq数据中发现的CTCF结合位点有成千上万个。本文通过对ENCODE数据库中转录因子CTCF的Ch IP-seq数据进行统计,基于67个细胞系的CTCF结合峰数据构建了全基因组范围内的CTCF结合位点全集,记为Sumpeak_set,共137471个位点。将67个细胞系的CTCF结合数据与Sumpeak_set中的位点进行对比,分别构建了对应于67个细胞系的细胞特异性结合位点(记为Cellline_Specific_peak)集合和非结合位点(记为Non_binding_peak)集合。首先,统计67个细胞系中共有的和每个细胞系独有的CTCF结合位点,分别用这些位点的序列信息搜索CTCF的结合模体。然后,从ENCODE数据库中下载了DNase-seq、12种组蛋白修饰、转录因子RAD21和SMC3的数据,计算了这些信号在Cellline_Specific_peak和Non_binding_peak集合的结合位点区域上的信号分布。最后将以上信息作为特征,利用卷积神经网络(CNN)和支持向量机(SVM)预测CTCF细胞特异性结合位点。在单特征预测中,仅用CNN一种机器学习方法,分别以DNase-seq信号和RAD21+SMC3为特征时效果最优,大部分细胞系的AUC值都在0.800以上;H2AFZ、H3K4me1和H3K4me2这三种组蛋白修饰在部分细胞系中的AUC值在0.700左右,模体信息以及其余9种组蛋白修饰信号的AUC值均在0.500左右。组合特征预测中,利用CNN和SVM两种机器学习方法。将DNase-seq、RAD21+SMC3和组蛋白修饰这三种特征分别组合进行预测,发现CNN方法的预测AUC值都高于SVM方法约0.004到0.05。结果表明,DNase-seq、转录因子RAD21和SMC3对CTCF的细胞系特异性结合位点具有较强的预测能力,而序列模体和组蛋白修饰信号对识别这些位点的贡献较小。这些研究对进一步解码CTCF的调控功能,分析转录因子与DNA相互作用机制提供了理论依据。
其他文献
TiN具有较高的硬度和耐磨性、低电阻率以及耐腐蚀性等优势,在切削涂层、新型陶瓷、航天器件、医用材料等方面应用较广。随着现代工业发展,需要TiN薄膜具备更高,更均衡的性能来满足当前工业应用的所有要求。通过掺杂第三种元素是提高TiN薄膜性能的一种途径,稀土元素由于其较高的活性和较大的原子半径,在薄膜中掺杂稀土元素是提升材料性能的有效方式。然而稀土元素掺杂TiN薄膜的改性研究较少。本文研究了Ce和Yb两
学位
急性髓系白血病(Acute Myelogenous Leukemia,AML)又称血癌,在造血系统的恶性肿瘤疾病中最常见,并且在成人群体中最常见类型为急性髓系白血病。随着测序技术的发展以及数据的量变以及开放,越来越多的研究表明,表观遗传修饰的异常变化会直接或间接抑制或沉默基因表达,包括组蛋白修饰和DNA甲基化等修饰,并且急性髓细胞白血病在表观遗传方面也有了一定的研究,并且在临床治疗取得肯定的疗效。
学位
珍珠菇是一种珍稀的食用菌,富含膳食纤维、粗蛋白、维生素和多种氨基酸,具有提高免疫力、抗癌、缓解肌肉酸痛等优点,且味道鲜美,口感顺滑,受到消费者强烈的欢迎,具有较高的经济价值和实用价值。为了拓展其育种方法,创造优质资源,本文以珍珠菇原生质体为出发材料,拟通过电晕电场诱变方法的优化,以及诱变后的珍珠菇菌丝体的生长速度、漆酶、蛋白酶、纤维素酶的活性变化,探究珍珠菇诱变育种的新技术和思路。实验结果如下:1
学位
元器件的微型化和小型化需求使磁电耦合材料的研究由块体转向了薄膜。磁电耦合薄膜材料在弱磁探测、磁电传感器、高密度信息存储器等微纳电子设备领域具有广泛应用,吸引着一批又一批的科研人员对其进行探索,时至今日已成为凝聚态物理重要的研究领域。磁电复合薄膜相比于磁电单相多铁材料在磁致伸缩相和压电相的选择上以及界面耦合调控方面有非常大的开放性,有望获得室温高强度的耦合效应,特别是2-2型磁电复合薄膜更容易满足器
学位
人类慢性髓系白血病(chronic myelogenous leukemia,CML)是一种起源于多能造血干细胞的恶性疾病。研究表明,转录因子及组蛋白修饰在基因组中结合模式的紊乱与CML的发生密切相关。因此,本文以人类慢性髓系白血病淋巴细胞系(K562)和人类正常B淋巴细胞系(GM12878)为研究对象。挖掘了与CML相关的重要组蛋白修饰和转录因子,并探究了组蛋白修饰执行其调控作用的重要功能区域。
学位
任何量子系统都不可避免地会与周围的环境发生相互作用,也就是说任何实际的量子系统都是开放的,如果存在信息从环境到系统的回流,就称为非马尔可夫动力学。我们知道,碰撞模型是研究非马尔可夫动力学的重要工具之一,并且在量子光学、量子热力学等领域得到了广泛应用。马尔科夫近似在大多数情况下是合理的,但有些情况必须考虑非马尔科夫过程,碰撞模型可以有效的处理非马尔可夫动力学。研究发现,通过引入系统环境初始关联等方法
学位
Cu2Zn Sn(S,Se)4(CZTSSe)薄膜太阳能电池因其具备带隙可调、吸光系数高、组成元素储量丰富、价格低廉、无毒无污染以及良好的稳定性等优势,被认为是未来最具有发展潜力的薄膜太阳能电池之一。然而目前其效率相比Cu(In,Ga)Se2太阳能电池仍相差甚远。经研究表明,高质量的吸收层与合理的器件结构是制备高效CZTSSe太阳能电池的基础。本论文系统地研究了阳离子成分调控及窗口层结构对CZTS
学位
氮化硼纳米材料因具有高温稳定性、低介电常数、较大的导热系数和抗氧化性,适用于电子器件、高耐热半导体、有毒气体传感器、绝缘体润滑剂和储氢材料,在材料科学、电子学等领域具有潜在的应用价值。零维纳米材料——氮化硼团簇由于其独特的物理化学性质,引起了人们的研究兴趣。团簇也可用作组装材料的基本构建单元,通过控制团簇的结构和性质可以得到人们所期望的团簇组装材料,并且这些具有优异性能的团簇组装材料对制备可控性能
学位
人们认为白光LED是一个节能、寿命长、全固态、环境友好的新光源。基于目前紫外LED芯片的荧光粉发射光谱中红色成分不足,如何实现光谱调控等问题备受关注。改进红光成分不足有两种途径:一种是开发新的材料,另一种是在现有的材料基础上,引入其它稀土离子。由于磷酸盐基质材料的荧光粉具有低色温、成本低、易获得等优势,本论文选择以磷酸钇锶作为研究对象,其研究结果如下:(1)第一部分是将Eu2+离子掺杂在基质Sr9
学位
方舱医院是疫情期间应对病患短时医疗需求激增的重要设施,其建筑空间环境营造的目标是安全、高效和人性化。本文从视觉感知的角度出发,通过重要度分析和层次分析法,探究方舱医院不同视觉感知影响因子对患者情绪和心理状态的影响,明确其视觉环境优化的重点,为提升方舱医院环境品质、优化病患服务水平提供参考。
期刊