三维基因组结构的数据集成最优化模型

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:t272162898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人以及其他哺乳动物的细胞核中,染色体并不是以线性方式排列,而是通过折叠缠绕形成了多层次的三维空间结构。染色体的空间结构与细胞内大多数的生物过程包括基因调控、DNA复制以及染色体异位等密切相关,例如线性距离上离得比较远的基因启动子区域和调控元件可以在三维空间产生物理相互作用,进而影响基因的表达调控。因此,染色质构象捕获技术与高通量测序技术相结合(Hi-C),可以直接获得全基因组范围染色质相互作用图谱,揭示出A/B区室、拓扑关联结构域、染色质环等不同尺度的结构特征。但是由于Hi-C实验的限制,数据分辨率都比较低,如何提高分辨率,重构三维基因组的精细结构是一个巨大的挑战。本论文从数据集成的视角,发展提高结构建模准确性的最优化方法。通过对多个分辨率、多个样本、多个层次的生物组学数据集成建模,结合低秩矩阵分解去噪,提升Hi-C数据的分辨率,重构三维基因组结构。并应用新方法到人类高原适应的调控机制研究中,揭示与适应相关的三维基因组结构变化。论文取得的主要结果如下:(1)提出了一个多样本多分辨率数据集成的最优化模型。充分挖掘在测序实验设计常用的多个生物学重复样本的Hi-C数据,以及每一个样本的的多个分辨率的染色质交互数据,通过低秩矩阵分解优化框架,综合不同层面信息。在多个Hi-C数据上实验表明,集成多个生物学重复的不同分辨率的交互矩阵,可提升三维基因组结构识别的分辨率。(2)提出了整合多组学数据的三维基因组结构重构的最优化模型。以Hi-C数据为基础,整合了ATAC-seq数据,RNA-seq数据,通过染色质相互作用区域的可及性状态、以及邻近基因的表达水平,提升三维基因组结构识别的分辨率。在公共数据集上进行测试,发现数据整合优化模型对Hi-C数据分辨率的提升具有很好的效果。(3)应用多组学数据集成的最优化模型到高原适应的三维基因组结构研究中,研究高原适应性的机理。通过对高原适应性的Hi-C数据的获取,处理,分析,以及用多组学数据集成优化模型提升数据的分辨率,比较了藏族人和汉族人在染色质结构多个层次的差异,从三维基因组的角度获得了藏族人高原适应性的一些新的认识。
其他文献
近年来,移动互联网用户数和业务量呈爆炸式增长,不仅推动了4G的快速发展,也对5G以及后5G移动通信系统提出了新的要求。传统的正交多址接入(OMA)已经难以满足未来移动通信中海量用户数据传输的需求,探索新型的多址接入技术迫在眉睫。非正交多址接入(NOMA)允许多个用户共享物理资源,具有提升频谱利用率、实现大规模连接等诸多优点,受到业界广泛关注。因此,本论文将基于因子图结构研究多用户非正交传输模型,对
伴随着国家城市化和工业化进程的不停加速和发展,国家的农村劳动力出现了大规模外出务工的现象。农村劳动力的转变给中国经济建设带来了非常巨大的改变。农民从原先的家庭关
近年来,移动通信技术获得了快速的发展,在系统容量、频谱利用、通信时延等方面都有显著的提升,但同时“物联网”的普及以及移动互联网业务量的爆炸式增长也给移动通信技术提出了新的挑战。一方面,移动设备接入量迅速扩增,未来移动通信网络需要更大的系统容量;另一方面,频谱资源有限,新一代移动通信技术需要更有效地利用频谱资源。非正交多址技术允许用户信号以非正交的方式共同占用通信资源,可以有效地提升频谱利用率和系统
本文以东周时期北方系腰带为研究对象,在腰带具类型学分析的基础上,进行分期研究和分区研究,归纳总结腰带具的发展演变规律和阶段性特征。论文分为五个章节。第一章:前言。界定论文研究的时空框架,总结东周时期北方系腰带的研究简史,提出目前研究中存在的问题、本文的研究内容及方法。第二章:类型学分析。依据装饰和系结功能的差别,将东周时期北方系腰带具分为带扣、饰牌、饰牌带扣、带饰四类,对这四类器物进行了类型学分析
近年来,飞机、潜艇、船只失事频频发生,水下无人航行器(Unmanned Underwater Vehicle,UUV)作为能够有效搜寻海底失事目标的重要工具,越来越受到研究人员的青睐,因此,本文以搜寻海底目标为背景,开展多航行器编队控制方法的研究。本文主要研究两大内容:UUV相对海底的定高航行和编队协调控制。本文的主要研究内容如下:首先,建立惯性坐标系和随体坐标系;根据UUV的运动学特征和动力学特
目的随着中医药学国际化步伐的加快,新时代对中药学英译甚至中药功效术语英译要求愈来愈高。但中药功效术语英译实践中表观翻译现象非常普遍,即停留在字面层次的翻译,这必然阻碍中医药的国际交流。该现象的根本原因为缺乏专业术语内涵的解析。因此,本研究尝试以“化痰”类中药功效术语为例,应用中药药性理论指导中药功效术语的英译。通过分析具有“化痰”类功效的药物的药性和临床应用,推导其功效作用特点,同时分析近年各类出
21世纪以来,我国工业园区的建设不断发展,为我国地方经济增长起到重要作用,与此同时,资源环境的保护也承受了巨大压力。随着社会经济的不断进步,生态文明建设要求的提出,我国开始重视对工业生态园区的建设,并积极学习西方发达国家的先进思想,涌现了许多优秀的设计作品。但是对工业园区的研究更多的是关于整体规划、生态工业系统共生等方面,工业园区景观设计方面的研究较少。在这此背景下,本文基于共生理论,结合宜宾六尺
四川盆地地下卤水中的矿产资源储藏丰富,分布广阔,是四川特有品质优异的矿产资源,综合开发利用前景十分广阔。四川盆地地下卤水矿产资源的综合利用和开发过程,需要相图的指导
无人艇(Unmanned surface vessel,USV)是一种体积小、机动性高、隐蔽性强、续航持久,可以实现自主控制的水面航行器。在海洋资源勘探活动中发挥了重要作用,但是无人艇在海上航行时会遇到风浪流等干扰,此时系统的不确定性会增大,从而降低了无人艇航向保持的精度。为了提高无人艇海上航行时航向控制的精度,本文结合自抗扰控制(Active Disturbance Rejection Cont
以知识图谱为代表的新一代人工智能技术的发展为唐诗数字人文领域的研究带来了新思路和新方法的变革,利用知识图谱提供智能化的知识服务成为唐诗数字人文领域研究的新方向。同时,随着唐诗大数据的增长,唐诗领域的知识服务需求也从传统的信息查询转变为希望满足精准化、专业化和智能化的知识服务需求,这一转变对细粒度、语义化的唐诗知识组织和表示方式提出了新的要求。然而当前互联网上的唐诗知识组织松散稀疏,复杂异构,大大增