基于集成学习的细胞类型及周期预测算法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:bian123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
染色质在细胞核内高度螺旋折叠,其三维结构与细胞内的基因表达调控机制密切相关,分析染色质各级三维结构的变化与细胞功能之间的关系已成为基因表达调控研究的一大热点。单细胞Hi-C数据是表达单个细胞核内所有染色质空间结构信息的数据,是研究异质细胞之间染色质各级三维结构差异的重要数据来源。挖掘染色质三维结构与细胞基本功能的关系需要明确每个细胞的类型,而进一步挖掘更紧密的关系,则需要在同类型细胞中明确细胞的周期。使用传统生物实验预测批量测序的细胞类型以及细胞的周期会耗费大量的人力、时间成本,极大的限制了染色质三维结构差异下游分析及相关算法的发展。而使用计算方法在单细胞Hi-C数据中预测细胞的生物学属性,具有效率高、操作简易等优点,可以为单细胞Hi-C数据研究提供强力的技术支撑。因此,本文以单细胞Hi-C数据为对象,基于染色质三维结构特性和集成学习方法研究单细胞Hi-C数据细胞类型和细胞周期预测算法,主要的研究工作如下:(1)构建基于集成学习的细胞类型预测算法针对目前面向单细胞Hi-C数据的细胞类型预测算法在预测细胞类型方面存在的预测结果不直观、预测精确度不高的问题,本研究基于集成学习构建有监督学习预测细胞类型算法scHiCStackL。本研究首先基于染色质三维结构特性对已有的细胞嵌入生成方法进行改进,然后基于Stacking集成学习构建预测细胞类型的集成模型。通过与scHiCluster、HiCRep-MDS、Raw_PCA_Ridge以及Decay_PCA_Ridge算法进行实验对比,scHiCStackL算法在人类细胞Hi-C数据集上的Acc值比性能次好的方法Raw_PCA_Ridge高出9.2%,ARI值、NMI值、F1值比性能次好的方法scHiCluster分别高出11.9%,10.2%,10.6%。(2)构建基于集成学习的细胞周期预测算法针对目前面向同类型细胞的细胞周期伪轨迹构建算法在预测细胞周期时无法直观地得到细胞的周期阶段,且预测精确度不高的问题,本研究基于集成学习和多尺度相互作用信息构建面向同类型细胞的细胞周期算法scHiCycPred。从不同的相互作用信息尺度,scHiCycPred提取了三种表示细胞内染色质三维结构信息的特征集,然后构建了基于多种特征集成的Stacking模型。与CIRCLET、MCM_FCNN、INS_1DCNN、scHiCStackL和Nagano等算法进行五折交叉验证和独立测试对比,对比结果显示scHiCycPred算法在Acc值上比性能次好的算法MCM_FCNN高出3.8%和5.1%,在MCC值上高出5.1%和6.7%,在F1值上高出3.8%和5.1%。
其他文献
“分数除法”是小学计算教学的重点和难点。研究人教版、北师大版、苏教版教材,发现这三个版本的教材均是按照“分数除以整数—一个数除以分数”的顺序来安排学习任务的,在例题的选择上则都注重与生活实际相联系,借助数形结合,探究并理解算理;运用类比迁移,渐进式掌握算法。对人教版、苏教版和北师大版这三个版本教材中“分数除法”内容的编排进行横向对比分析,总结出有利于学生理解分数除法计算法则的学习路径。
期刊
黄瓜是世界上种植面积最广的蔬菜之一,也是我国重要的温室经济作物。其中,黄瓜霜霉病和黄瓜角斑病是温室中极易发生的病害,由于其发病周期短、传染性强的特性易给农户造成较大的经济损失。随着计算机技术的不断发展,黄瓜病害诊断模型得到广泛的应用,很多基于卷积神经网络构建的植物病害诊断模型取得了优异的效果。但现有的很多模型是在背景单一的植物病害图像数据集构建的,在实际生产环境中应用时,复杂田间环境的引入会影响模
学位
<正>“中华民族共同体意识是国家统一之基、民族团结之本、精神力量之魂”。党的十八大以来,在一系列有关“中华民族共同体意识”的论述中,我们能够看出,民族工作要在新的时代要求下,不断加强对中华民族共同体的建设。中华优秀传统文化在推进中华民族共同体建设中为其提供了文化基因、贡献了精神力量,并为中华民族伟大复兴凝心聚力。“优秀传统文化可以说是中华民族永远不能离别的精神家园”。其所蕴含的价值观念、民族精神、
期刊
开展铸牢中华民族共同体意识教育,是新时代思想政治工作的重要内容,也是培养能够助力民族发展的人才的客观要求。中职院校开展铸牢中华民族共同体意识教育,可以促进学生牢固树立中华民族共同体意识,增强民族凝聚力,推进中华民族的伟大复兴。基于此,文章将分析铸牢中华民族共同体意识的教育机理,探究铸牢中华民族共同体意识的实现路径。
期刊
竹子和兰花都是中国传统文化植物的重要种类,由于对其特殊的审美意味,使得我国古今园林中多有竹兰的身影。近几十年,各种竹子更是在城市绿地系统中得到广泛应用,形成了具有很高观赏性和一定生态经济价值的竹林景观。但在竹景观应用过程中也逐渐暴露出诸多问题,如竹林景观模式单一、林下适生观赏植物少和植物配置方式简单等,进而导致了竹林景观空间结构单调、植物群落多样性低、林下杂灌丛生和土壤裸露等现象。白及(Bleti
学位
随着城市化的快速发展,城市内的环境、气候也随之变化。城市的高温天气逐渐增多,热岛效应逐渐增强,严重影响了居民的生活环境,威胁居民的身体健康,降低居民的幸福感。南阳市作为豫西南的经济中心,近年来热岛效应逐渐明显。研究南阳市主城区热岛效应的时空分布与形成机制,探究绿地的降温效应及影响因素,利于有针对性的采取缓解热岛效应的措施,以期构建宜居的城市生活环境,提升居民的生活品质。本文以南阳市主城区为研究区,
学位
随着近年来城市边界的迅速扩展,城市的用地结构布局发生了巨大变化,导致了城市内部以及周边绿地减少,动植物生境栖息地受到严重的破坏,这对城市生态系统服务功能的发挥以及人类生活福祉产生了不利影响。在城市发展转型的当下,如何权衡城市发展和生态保护的利弊关系,成为一个如今亟待解决的难题。合理规划城市绿色空间格局,修复城市关键区域的生境,改善城市生态环境,是实现城市可持续发展最重要的一步。厦门作为闽三角城市群
学位
本文通过对《三国演义》诸葛亮舌战群儒相关情节的梳理,分析了作者的行文特色以及辩论技巧,并在此基础上阐述了语言和思维、阅读和写作的关系。
期刊
干旱是影响植物生长的非生物胁迫之一,干旱区土地退化和土地荒漠化的典型特征之一就是盐碱化。为筛选出部分具有优良耐盐、耐旱能力的植物,明晰其生长过程中对逆境胁迫的生长生理响应规律以指导养护管理等工作,本研究选取在我国具有较广分布范围的狼尾草属、芒属,以及其他具有较高美学、应用价值的共13种观赏草为研究材料,在种子萌发期利用不同浓度的PEG、Na Cl溶液分别模拟干旱和盐胁迫,运用投影寻踪算法综合分析,
学位
当前,随着COVID-19疫情在全世界范围内的不断蔓延,城市瘟疫不仅对人们生理健康产生破坏,同时对心理健康及社交健康也有一定的损害。城市居民面临多方面的压力,城市公园是人与自然连接的场所,疫情的产生对城市公园服务功能提出新的要求。从景观偏好角度入手构建城市公园健康景观既能够满足游客视觉上的基本需求,也能提升公众参与景观构建的力度,还能提供疗愈身心健康的景观。基于NVivo质性分析和位置大数据分析手
学位