基于DNase高通测序信息的DNA蛋白结合位点识别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:GAODAOQUAN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自人类全基因组计划以来,对转录因子以及其结合位点的研究成为人类探索生命本质的重要课题。转录因子只有在与特定的结合位点结合之后才具有调控基因表达的功能。所以,准确识别出转录因子结合位点的位置成为遗传学的核心内容之一。2010年,Crawford提出的DNase-seq技术可以实现单次实验即可检测出全基因组范围内的蛋白结合位点。DNase-seq技术相比于目前广泛使用的ChIP-seq技术、ATAC-seq,表现出了诸多的优势,在提高检测效率和检测精度的同时,大幅降低了检测成本。  在本课题研究中,首先在网站上获取到DNase-seq数据以及转录因子的有关数据。然后,利用FIMO工具得到确切的转录因子结合位点,提取整理每个结合位点的DNase-seq数据并构建数据集。随后,根据DNase-seq数据特点选择并构建了基于自动编码器神经网络的转录因子结合位点识别模型。接着,从转录因子结合位点的典型性和测序深度两个方面对所构建模型的识别结果进行分析,从而确定使用该识别模型所需的条件。最后,考虑到数据集的大小存在着不平衡的因素,我们选用指标灵敏度、特异性以及马修相关系数等指标来对所构建模型的识别能力进行评价,既衡量了分类器对正例的识别能力,又衡量了分类器对反例的识别能力,同时也验证了模型的可靠性。  通过对识别模型结果的评估,所设计模型能够有效地实现基于DNase-seq数据的转录因子结合位点的识别,并为构建在全基因组范围内的转录因子调控网络打下了基础。
其他文献
电控系统的发展正在改变汽车的传统结构和扩展汽车的功能,由于汽车上具有ECU(Electronic Control Unit,电子控制单元)的部件越来越多,且其功能和性能越来越强,使电控系统的开发过
仿人机器人是机器人研究领域的研究热点。传感技术是仿人机器人研究的关键技术之一。仿人机器人之所以能在已知或未知的环境中完成一定的作业功能,是因为它能够通过传感器感
近年来,数字图像处理技术发展迅速,基于机器视觉的各种检测技术逐步从研究领域走向实用化阶段。仪表颜色检测用图像处理与识别技术测量颜色之间的差别,可以显著提高对仪表颜
随着航空电子系统综合化、模块化的发展,传统的开发模式已经很难满足新一代开放式座舱显示系统的设计需求。ARINC661规范将画面显示与画面控制分离,分别定义了图形用户接口和
随着风能、太阳能、生物能等可再生能源开发规模的不断扩大,其固有的分散性、小型性、远离负荷中心等特点日益突显出来。基于变流技术的柔性直流输电技术具有小型、高效、控制灵活等特点,经济效益和环保价值可观,并能有效地减少输电线路电压降落与闪变,提高电能质量。详细阐述了柔性直流输电系统(VSC-HVDC)的组成结构及其功能,并对整个系统的核心部分——电压源型换流器(VSC)作了重点研究,对其调相原理和运行特
本文详细研究了分数阶pIλDμ控制器中Kp,Ki,Kd,λ,μ这5个参数的多种整定方法和如何硬件实现嵌入式PIλDμ自整定控制器。主要包括两部分,第一部分是前五章,主要研究的是分
岩体在破坏之前,必然持续一段时间以声的形式释放积蓄的能量,即岩体声发射。结构越临近失稳状态,其发出的声发射信号就越强,因此岩体声发射信号直观精准地反映了岩体内部变化
惯性导航系统是一种完全自主的导航系统,是航天、航空和航海等领域中广泛使用的主要导航系统,在导航领域中占有突出的地位。新型高性能飞行器所具备的灵活机动与多模态飞行特
在现代工业生产控制中,很多情况下由于控制器的输出需要得到优化,需加以一定的约束,这样就会保证控制系统可以按事先设定好的运行,达到所期望的控制效果。因此,如何实现对一
复杂性科学被称为“21世纪的科学”,在经济管理领域中存在大量复杂问题如群体决策、管理创新、经济发展等,这些问题都需要运用复杂性科学的理论及方法加以研究。复杂网络理论是