基于局部保留投影的空间转录组快速降维算法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:network_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究空间转录组数据的降维问题。空间转录组技术可以在测量基因表达的同时保留了细胞在组织上的空间位置信息,弥补了单细胞转录组技术因细胞解离而导致的细胞位置信息丢失。与单细胞数据类似,空间转录组数据同样具有高维、复杂、高噪声和高稀疏性等特点,在下游分析之前有必要对空间转录组数据进行降维。但由于空间转录组数据中邻近位点的表达存在高度相关性,许多经典的降维方法(如主成分分析等)无法有效利用。因此,我们迫切需要一种快速、高效的,适用于空间转录组数据的降维方法。利用位点的空间邻域网络和局部保留投影算法,本文提出了一种针对空间转录组数据的降维算法Spatial LPP,该方法通过提取空转基因表达信息,保留了组织位置之间的空间相关性,提升了空间域检测等下游分析问题的准确性。本文首先,介绍了空间转录组实例数据集的具体信息;其次,介绍数据预处理的步骤,包括质量控制、数据归一化、对数化、空间高变基因(SVG)筛选等;再次,分别对预处理后的数据进行三种类型的降维操作,包括主成分分析(PCA)、非负矩阵分解(NMF)和Spatial LPP三种算法,对于三种降维方法得到的数据做Kmeans聚类,并比较专门为空间转录组数据聚类开发的算法Bayes Space与Spa GCN,这三种算法的空间域检测性能差异以及下游分析能力。对于降维算法,我们还测试了不同维度对模型性能的影响。结果显示,Spatial LPP在常用的三个数据集(人类脑背外侧前额叶皮质数据、由10X Visium生成的鼠脑数据、从STARmap获取的小鼠内侧前额叶皮质数据)上的降维性能优于其它四种算法。最终结果表明,Spatial LPP降维算法可以充分利用空间转录组数据中组织的空间位置信息,提高包括空间域检测在内的有效下游分析性能,有望应用于不同技术平台下获取得的空间转录组数据。
其他文献
贝叶斯学习是机器学习领域中一类重要的方法,它能够结合先验信息和样本中的信息捕捉参数的不确定性,进而获得目标后验分布。马尔可夫链蒙特卡罗采样通过生成一个平稳分布为目标后验分布的马尔可夫链来实现参数抽样,并用抽样生成的离散样本来近似目标后验分布。随着巨大的信息量和数据流的出现,如何高速且低成本地处理这些数据,发现大数据中存在的信息成为人们目前主要的关注点。马尔可夫链蒙特卡罗方法在处理大数据集时的计算成
学位
目的:分析研究个性化快速康复外科理念对胸腔镜手术治疗非小细胞肺癌患者的效果分析。方法:选择我科2019年1月~2021年8月接收的胸腔镜非小细胞肺癌手术患78例作为研究对象,随机将其分为对照组39例(常规护理)和观察组39例(个性化快速康复),对比两组相关指标。结果:观察组置管时间(1.23±0.09)天、下床活动时间(11.38±0.21)小时、住院时间(2.97±0.11)天较对照组短,P<0
期刊
房地产业作为国民经济的支柱产业,与金融业深度关联,关系到整个国家的金融体系稳定。2017年以来高杠杆率已成为房地产行业的主要风险因素之一,各部门纷纷出台各种限制性融资政策,遏制房地产杠杆率野蛮增长,防范系统性金融风险,特别是2020年出台的“三道红线”政策,规定通过设置资产负债率、净负债率和剔除预收账款后的现金短债率门槛,限制房地产企业有息负债增长率,降低杠杆率。各家房企虽积极降杠杆,不少公司完成
学位
尖端科技力量和数字经济的热潮正驱动着中国房地产行业以数字化转型作为战略目标,从而带来多样化的业务场景和更加精细化的市场需求挖掘与服务体验。在经济环境不确定的宏观时代背景下,数字化转型正愈发清晰地成为房地产及中介行业的未来。贝壳找房是国内房产经纪服务行业的龙头,也是房产经纪领域唯一的平台型企业,由深耕“真房源”的线下品牌“链家”和线上的房产服务平台“贝壳”结合而成。公司通过打造数字化基础设施、服务流
学位
<正>点语,你好:再过几天就是你十岁的生日了,正如童子班的一位同学说的,"时间像子弹一样穿膛而过",我想给你写封信,和你谈谈学习。学习到底为什么?不同的人会给出许多不同的答案,我正在读1987年诺贝尔文学奖获得者布罗茨基的一本书,书名叫《文明的孩子》,这是
期刊
在重症监护室中,脓毒症是患者死亡的主要原因之一。早期预测脓毒症是必要的,可以帮助ICU医生做出最佳的临床决策,从而改善患者的临床结果。本文使用了重症监护研究的多中心数据库e ICU-CRD,数据库中诊断为sepsis-3的患者被纳入了研究。本文共筛选出2483例患者数据,其中2250例为住院30天内的存活病例,233例为住院30天内的死亡病例,每位患者都有首次入院24小时内的数据,每间隔一小时会产
学位
从某种意义上来说,当代艺术是一种表达观念的艺术,它重新解构了人类与艺术之间的关系,当代艺术更加注重自我的表达,在题材上选取贴近现实生活的事件,在形式上丰富多彩,在艺术语言上多维化,在传统文化上另辟蹊径,在创作角度上新颖,当代艺术的出现大大更新了传统单一的美术形式,而大观念教学可以有效整合零碎的知识点,使学生理解知识的本质,有助于发挥课程育人功能,在此基础之上,可以培养学生们的批判性思维,提高认知维
学位
组合是白酒生产中储存环节的重要工艺,如何提高白酒贮存质量稳定性、降低酒体损耗一直是行业重要研究课题。本研究通过建立理化指标、人工成本和时间成本三因素的综合影响因素模型,计算得到浓香型白酒最佳组合比例。通过小试和中试验证,白酒组合后,酒的感官评分、总酸、总酯和风味组分等指标更为稳定,该技术对白酒贮存后用于成品酒设计的质量和效益产生了重大影响。
期刊
癌症一直是人类公共健康领域的主要威胁之一,是全球第二大死因,每年全世界约有上千万人死于癌症。本文基于癌症基因组图谱计划(TCGA)数据库中的泛癌基因组数据,使用多种统计分析方法评估了ARHGEF2基因在泛癌中的影响和作用,探究并证明了其潜在的治疗靶点功能。本文首先对基因表达数据进行对数标准化,使用Wilcoxon秩和检验分析了目标基因在正常样本和肿瘤样本中的表达差异,发现目标基因在29种肿瘤样本中
学位
急性肾损伤是一种常见的临床综合征,通常指肾功能在7天之内突然下降,临床表现为血清肌酐的升高或尿量的减少,从而导致肾脏过滤和排泄身体代谢废物的功能丧失。急性肾损伤的发病速度快,死亡率高达20%-60%,约有10-15%的住院患者和5 0%以上的重症监护病房患者会受到急性肾损伤的困扰。本文考虑了临床医学中较为常用的13项指标,预测急性肾损伤患者住院期间死亡率。具体的来说,本文总结了优秀LSTM模型变体
学位