基于深度学习的单细胞RNA-seq数据挖掘研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:caikesbad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着单细胞RNA测序(scRNA-seq)技术的日益发展,涌现了海量的测序数据。利用计算方法深入挖掘scRNA-seq数据中的基因表达信息,不仅对于基因调控网络构建、胚胎发育和大脑神经研究具有重要指导作用,还可以为药物研发和临床医疗提供重要依据。而深度学习的发展,使得基于深度学习挖掘单细胞RNAseq数据已经成为生物信息学的研究热点。本课题基于深度学习对scRNA-seq数据信息进行挖掘研究,主要研究内容如下:1.提出基于双重自编码网络的scRNA-seq数据降维方法,称之为sc-bi AE。首先利用经典自编码网络对scRNA-seq数据中的dropout事件进行插补,自编码网络重构数据的过程,可以减少由高稀疏性引起的分析偏差。其次利用降噪自编码网络去除数据噪声并降低数据维度,获取反映数据本质特征的低维子空间。最后通过K-means聚类方法测试模型的有效性。通过四个常用指标结果表明,scbi AE在公共的scRNA-seq数据集上的降维结果明显优于其它十种流行的降维方法。为进一步测试sc-bi AE的泛化性能,本文分析了模型在不同维度,不同训练批次以及不同损失率参数下的结果。最终结果表明,sc-bi AE使用深度学习中两种不同的自编码网络,不仅可以减轻dropout事件造成的影响,而且可以进一步去除scRNA-seq数据中的冗余信息,为聚类分析提供准确信息,甚至sc-bi AE有望为降维其它生物医学数据提供一定借鉴。2.提出基于高斯混合模型和自编码网络的scRNA-seq数据聚类方法,称之为sc GMAI。首先利用深度学习中的经典自编码网络重构scRNA-seq原始数据,减少dropout事件引起的分析误差。其次使用快速独立成分分析去除冗余信息,得到代表scRNA-seq数据本质特征的潜在空间。最后利用高斯混合方法准确聚类并识别细胞类型。通过四个聚类指标结果表明,sc GMAI在公开的scRNA-seq数据集上的聚类性能优于目前流行的scRNA-seq数据分析方法。为进一步测试sc GMAI的性能,绘制了聚类可视化图像、基因表达热图以及差异表达基因信号分析图像。最终结果表明,基于深度学习和高斯混合方法构建scRNA-seq数据聚类模型,不仅可以准确识别scRNA-seq数据中的细胞类型,而且可以为scRNAseq数据差异表达等下游分析提供准确信息。更重要的是,该模型可以应用于大规模的scRNA-seq数据集(比如,十万细胞)。
其他文献
为了适应"新医科"建设对医学教育提出的新要求,对全科医学概论课程改革开展了积极探索。在"以学生为中心"的教育理念指导下,以"新医科"要求与全科医学特色相结合为抓手,进一步调整课程目标,从丰富课程资源、强化课程思政、创新教学模式、完善考核评价体系等方面开展课程改革的探索与实践。同时,对教学改革进行总结与反思,提出改进建议。
现如今对机器人的研究进行的如火如荼,并取得了很大进展,研究成果也广泛应用与大众领域。机械臂是一种比较成熟的机器人,其集合了计算机、电子信息、控制程等多领域知识,更是作为人工智能学习最好的载体,现已广泛应用到了高校的日常实验教学中。但是由于机械臂设备成本较高,大多数高校会受到设备数量限制,并且设备使用频率高导致损坏率高,高校实验室建设成本高,同时完全虚拟化实验的应用场景及开发环境不够真实。为了能够让
以直链烷烃及其混合物为主要构成的石蜡基相变材料由于较低的热输运性能使得其在热能储存及能源管理方面的应用受到了极大的限制。随着新型纳米技术的发展,诸多纳米添加剂如碳纳米材料及金属纳米颗粒等被添加入相变材料中构成复合相变材料来提高相变材料的热输运性能,改善传统相变材料的导热性能。为了研究复合相变材料中烷烃分子的微观行为及其与碳纳米材料以及金属纳米添加剂间的相互作用,采用MD模拟方法以及声子输运理论,本
综述了近年来低温固化型光敏聚酰亚胺(PSPI)材料的研究与应用进展,根据低温固化机理的不同,主要从合成可溶聚酰亚胺、优化聚酰亚胺分子结构与配方、合成聚异酰亚胺以及催化聚酰胺酸反应等方面,分别介绍了制备低温固化型PSPI的方法。分析了目前低温固化型PSPI材料的应用现状,介绍了目前规模商业化的低温固化型PSPI产品,包括正性产品与负性产品两大类。最后对国内未来低温固化型PSPI材料的应用与发展进行了
二氧化碳混相驱油技术作为三次采油技术的一种,在提高采收率及温室气体地质埋存方面具有广阔的前景,尤其在对水驱过后的致密油藏采油方面,二氧化碳混相驱受到业界的广泛关注。在此背景下,本文展开了对CO2/油/水体系混相特性及扩散特性的实验研究。本文就二氧化碳混相驱中两个重要参数——最小混相压力和相间扩散系数,展开了重点研究。在最小混相压力的研究中,主要研究了水相对油水体系最小混相压力的影响。使用了动态体积
减振器是汽车上及其重要的零部件,其性能对汽车的安全以及乘坐体验都有着很大的影响。往复式骨架油封用于汽车减振器密封,它能阻止减振器工作缸内的润滑油通过活塞杆与导向器之间的缝隙泄漏到外界环境中,同时能够阻挡外界会灰尘颗粒进入到减振器内部。油封往往是不可拆换的,因此一旦油封出现问题,就需要更换减振器,成本高昂。外界灰尘颗粒的进入会影响减振器性能和使用寿命,于是,人们希望油封能尽可能的阻止灰尘进入到汽车减
开发利用清洁替代燃料实现能源生产和工业燃烧的去碳化成为近年来国际上最重要的研究热点之一。氨(NH3)作为一种高能量密度的富氢载体以及零碳能源,被寄语为极具吸引力和前途的新型无碳替代燃料。然而NH3燃料的低反应性和高氮氧化物(NOx)排放问题严重制约其大规模工业应用。针对NH3燃烧增强方法与NOx减排机制的研究现状,开展基于燃料预热的NH3/空气燃烧增强方法与排放规律研究。设计搭建由NH3预热装置、
中频感应加热电源是大型工件加热过程中的重要设备,其感应加热过程中的温度控制算法的优劣会直接影响到工件焊后稳定化热处理的质量。由于不同类型的工件形状和材料不同,其加热所需的功率及生成的温度曲线各不相同,难以建立精确的数学模型。且工件热处理过程具有非线性、大滞后的特征,传统PID方法温度控制效果较差,因此为保证温控过程的稳定性,必须采取精准的控制方法。为解决采用传统PID不能对系统输出进行精确控制的问
在矿山充填开采中,胶结充填体的力学性质对预防采区上覆岩层移动和地表沉陷具有直接影响。因充填深度的不同,胶结充填体受到来自地温和地压的复杂影响,因此研究胶结充填体在地温、地压影响下的力学性质对深部充填采矿的安全开展具有重要的意义。本文依托于国家自然科学基金“深层软岩体流变、蠕变、固流转化统一理论及控制技术的研究”(51674149),以山东某金矿的全尾砂为骨料、用水泥胶结配制全尾砂胶结充填体试样。本
随着知识经济的到来,传统单体架构的知识管理系统操作复杂、代码难以修改且规模庞大,导致运营和维护出现众多问题。因此,以提高工作效率为目的,对传统单体架构的知识管理系统进行更新和完善显得尤为重要。笔者将从知识管理系统概念出发,分析知识管理系统对于企业组织的重要性,然后从API网管技术架构、配置中心技术架构、后台管理与服务技术架构3方面进行技术架构分析。