基于无监督深度学习的单细胞RNA-seq数据分析

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:babyface_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着单细胞RNA测序(scRNA-seq)技术的不断发展壮大使得研究人员可以从单个细胞的基因表达转录普中分析和解决生物学问题。面对海量的单细胞测序数据,无监督深度学习可以准确高效地实现数据的整合与分析。在单细胞分析过程中,降维和聚类是分析必不可少的步骤,其目的是用来去除scRNA测序数据中的冗余信息,探寻细胞的种类以及数量。神经网络的快速发展,使得scRNA测序数据摆脱了传统算法耗时久,精度低等束缚。无监督深度学习与scRNA测序数据的结合使得研究迈向更为广阔的天地。本文基于无监督深度学习对单细胞RNA测序数据进行研究,研究内容如下:1.提出一种新的聚类方法,该方法使用小波降噪并结合经典自编码网络,我们称之为sc-WAE。首先,通过训练选择合适的小波来重构scRNA测序数据,将原始数据中大量的非真实零值重构为具有实际含义的数值。其次,使用经典自编码网络来降维重构后的数据。自编码降维过程,充分展现了无监督深度学习在大数据集上无可比拟的处理优势,从而快速获得低维且有效的scRNA测序数据进而提高单细胞数据的分析效率。最后,使用变分贝叶斯高斯混合模型对细胞进行聚类,然后将聚类结果可视化并且利用原有的真实细胞标签计算并评估聚类性能。我们使用十个真实的scRNA测序数据集来评价我们提出的sc-WAE方法。将我们新提出的聚类方法的结果与已发表的四种聚类方法进行比较,综合四种聚类评价指标结果,证明了sc-WAE方法的聚类效果总体上优于其它四种聚类方法。2.提出一种基于双自编码结合变分贝叶斯高斯混合的聚类方法,我们称之为sc-VBDAE。首先,通过对抗自编码网络的编码和解码过程,scRNA测序数据被重构。重构后的单细胞基因表达矩阵中数据发生了明显的改变,原有的零值被重构为非零数值。其次,使用经典自编码网络对重构后的scRNA测序数据进一步降维处理,从而获得低维且有效的scRNA测序数据,进而再次提高scRNA测序数据的分析效率。再次,使用变分贝叶斯高斯混合模型对scRNA测序数据进行聚类。最后,将聚类后的scRNA测序数据进行下游分析并可视化分析结果。我们选取了十个具有代表意义的单细胞数据集,将我们提出的方法依次运行得出聚类结果,根据四种聚类评价指标证明我们的方法具有很好的聚类效果。与此同时我们运行了另外五种聚类算法,并与我们所提算法进行比较,结果进一步证明我们的方法总体优于其它聚类方法。
其他文献
目的:观察中药熏蒸联合强脉冲光治疗睑板腺功能障碍性干眼的的临床疗效。方法:收集2021年1月至2021年10月期间,就诊福建中医药大学附属第二人民医院眼科的符合纳入标准的风热证睑板腺功能障碍性干眼患者108例216眼,按随机数字表分为中药熏蒸组、强脉冲光组、中药熏蒸联合强脉冲光组,各36例72眼。中药熏蒸组予疏风清热经验方熏蒸,每4天1次,共8次;强脉冲光组予强脉冲光治疗,每14天1次,共3次;中
盐碱土壤放线菌抗逆能力强,是一种存在于高盐高碱区域中的极端微生物,其特殊的生理机制和代谢产物的多样性广受各领域的关注。为了更有效地挖掘盐碱土壤放线菌资源及其功能基因,充分了解盐碱土壤放线菌物种的多样性,选择最适分离方法至关重要。笔者综述了中国盐碱土壤放线菌的地理分布和资源多样性,统计并总结2000—2021年盐碱土壤放线菌新物种的情况,整理归纳盐碱土壤放线菌的主要分离筛选方法,并对之后的研究工作提
目的 构建神经重症专科护士核心能力评价指标体系,为神经重症专科护士培养及评价提供参考依据。方法 查阅国内外文献及参考相关指南,根据护士核心能力的相关要求,形成初步体系。运用德尔菲法及层次分析法,确定神经重症专科护士核心能力评价指标。结果 该研究共纳入20名咨询专家,2轮咨询中专家权威系数分别为0.934、0.940;各级指标的肯德尔和谐系数分别为0.111~0.143和0.144~0.367(P<
目的 基于秦泗河矫形外科数据库中足踝畸形患者临床资料,分析足踝畸形发病特征与治疗策略,为临床决策提供依据。方法 检索秦泗河矫形外科数据库,纳入1978年5月25日-2020年12月31日接受矫形手术治疗的22 062例足踝畸形患者。统计患者性别、手术时年龄、区域分布、病因、畸形种类、手术方式、术后固定方式等信息。结果 22 062例患者中,男13 046例(59.13%),女9 016例(40.8
目的:探讨热脉动联合光润强脉冲光 (Intense pulsed light,IPL) 治疗睑板腺功能障碍性干眼症的效果。方法:选取 2019 年 7 月—2020 年 9 月东莞爱尔眼科医院收治的 106 例 (212 眼) 睑板腺功能障碍性干眼症患者作为研究对象,进行前瞻性随机对照研究,根据Doll’s 临床病例随机表分为研究组 (36例,72眼)、对照A组 (35例,70眼)、对照B组 (3
目的:观察强脉冲光(Intensive pulse light,IPL)联合睑板腺热敷按摩改善睑板腺功能障碍(Meibomian gland dysfuction,MGD)相关干眼症患者结膜上皮损伤及眼部功能效果。方法:选取笔者医院收治的82例MGD相关干眼症患者,根据入院先后顺序将其分为对照组41例与观察组41例,前者给予睑板腺热敷治疗,后者在前者治疗基础上予以IPL治疗,对比两组治疗效果、结膜
槟榔是海南省主要经济作物之一,近年来,槟榔种植面积不断扩大,致使病虫害普遍发生,严重影响了槟榔的产量和品质。目前生产中还是以化学防治为主,这不但会使病原菌易产生抗药性,而且易造成环境污染,这与海南旅游生态省的建设初衷不符。生物防治最大的优点就是不污染环境,是病虫害防治的主攻方向。拮抗微生物是生物防治的主要原材料,而放线菌是拮抗微生物的主力军,具有巨大的应用潜能。本研究在海南省文昌市、琼海市、万宁市
近年来随着大数据越来越广泛地应用于生产生活的各个领域,大数据分析的需求和对大数据人才的培养需求也越来越迫切。大数据分析技术是其他领域开展科学研究的重要技术之一,“大数据分析”作为本科生课程应该注重实践能力的培养。为保证人才培养的时代性与实效性,本人拟在课程教学中拓展深度学习算法在大数据分析中的应用,深化大数据分析技术的并行编程;为突出我校中医药特色,引入生物医学相关案例,整合计算机专业本科生所学知
在现阶段的幼儿园教学活动中,综合考虑到幼儿的年龄特征和学习特点,在幼儿园教学活动中,教师要更加注重教学的多样性。通过开展寓教于乐的教学活动,为幼儿构建一个健康快乐的成长环境。在幼儿教育中加强幼儿足球教育活动,为了实现以体促美的教学目的,在体育教学中教师要更加注重学生学习兴趣的激发,为学生构建一个良好学习环境,以此有效激发幼儿的学习兴趣,为幼儿构建一个良好的学习环境,达到以体促美的教学目的,有效促进