基于流形学习的单细胞降维算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:smlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单细胞RNA测序在发现细胞类型、识别细胞状态、追踪发育谱系、重建细胞空间组织等方面有着巨大的潜力。随着单细胞测序技术的发展,测序的结果越来越细致,单次可测量的细胞越来越多,这些单细胞中蕴含了丰富的信息,在分析和处理这些数据的过程中,有效降维就显得更为重要。本文研究了当前流行的单细胞数据降维算法t-SNE,并把线性降维算法PCA和两种经典的基于流形学习的降维算法LLE和MDS应用到单细胞数据降维处理的过程中。并通过对四种算法的分析研究,提出一种结合降维方法。先用PCA对原始数据进行降维,然后再分别用LLE,MDS和t-SNE进行二次降维。本文首先从GEO数据库中选取数据,然后对数据进行筛选和预处理,接下来使用Linnorm归一化方法,统一数据标准,然后对数据集进行降维聚类处理,并计算ARI值。最后通过算法运行时长和ARI值,比较四种算法的优劣并进行分析。本文选取了GEO数据库中的一个公开数据集作为实证分析的处理数据集,此数据集包含六个样本。本文首先使用四种降维算法对这六个样本进行降维,通过算法运行时长和ARI值比较这四种降维算法的优劣。然后针对这几种算法存在的问题,通过算法结合的方式,对降维效果进行提升,并比较结合前后算法的降维效果。最后对三种结合算法的降维效果进行比较。从结果来看结合后的算法不仅缩短了算法的运行时长,还提高了算法降维的准确性,具有一定的应用价值。
其他文献
生态数据存储规模随着生态学领域研究尺度的拓展不断扩张,而传统中心化数据存储方式面对日益庞大的海量生态数据越来越难以为继,观测数据易重复、易篡改、难共享以及存储成本
合成孔径雷达(Synthetic Aperture Radar,SAR)自提出以来就作为一种非常重要的探测成像手段被广泛使用。自提出至今,SAR广泛应用于国防、城市道路检测以及自然灾害监控等方面
切换正系统是一类特殊的切换系统,在工业生产实践中具有广泛的应用。切换正系统的优化和L1增益问题在控制科学与工程领域一直是一个热门研究课题,其对于生产过程自动化、自动
航空发动机是飞机的核心动力装置,针对航空发动机的故障预测与健康管理,对于提高飞机的安全性和降低飞行的成本有着至关重要的作用。发动机剩余使用寿命的预测方法是近年来飞
当前我国经济处于转型升级向高质量发展的时期以及在全球向智能制造变革背景下,制造业中的许多中小企业面临的市场形势发生较大变化,多品种、中小批量的市场需求成为常态。在
人们对个人隐私的关注不断提高,然而现实中许多业务对民众的个人信息却保护不足。例如,在快递面单上,以明文的方式显示着用户的诸多个人信息,因此,有研究者使用分段加密来防
近年来,服务器内存容量的迅速扩大使得应用程序逐步将更多数据存入内存中,这也引发一个新的计算模型——内存计算。内存键值存储系统因其语义通用、使用方便而备受关注,如Mem
图(Graph)是一种以顶点和边构成的包含多种信息的复杂数据结构,图计算(Graph Computing)则是在图数据中寻找一定关系的一类计算的总称。图计算将现实条件中的关系属性抽象为图数据结构并进行复杂计算,而如何在极大规模的图数据集上完成高性能的计算是图计算需要解决的关键问题。可编程逻辑门阵列(Field-Programmable Gate Array,FPGA)作为并行化的计算密集型加速硬件
情感是人类日常生活中至关重要的一部分,在人类的认知、互动、决策过程以及对外界环境的感知中都起着重要的作用。近年来随着人工智能(Artificial Intelligence,AI)技术的研
面部表情承载着人类的情感信息,被视为是超越了种族和文化多样性的一种通用语言。深入研究人脸表情识别,有助于更好地理解人类的情感状态和心理活动,在人机交互中实现更智能