【摘 要】
:
单细胞测序技术的发展,让我们能够以低成本、高精度获得大量的单细胞转录组数据,使其成为揭示细胞间异质性和窥探细胞发育过程的有力工具。在分析细胞发育过程的基因动力学和变异性的复杂性时,使用单细胞基因表达数据重建细胞分化的伪时间轨迹是目前研究的热点和面临的挑战。尽管最近已经开发了许多用于单细胞分析的计算和统计方法,但现存方法都有其局限性和改进的空间,更高效准确的算法仍待提出。细胞分化伪时间轨迹的重建主要
论文部分内容阅读
单细胞测序技术的发展,让我们能够以低成本、高精度获得大量的单细胞转录组数据,使其成为揭示细胞间异质性和窥探细胞发育过程的有力工具。在分析细胞发育过程的基因动力学和变异性的复杂性时,使用单细胞基因表达数据重建细胞分化的伪时间轨迹是目前研究的热点和面临的挑战。尽管最近已经开发了许多用于单细胞分析的计算和统计方法,但现存方法都有其局限性和改进的空间,更高效准确的算法仍待提出。细胞分化伪时间轨迹的重建主要由数据处理和细胞排序两部分组成。其中数据处理是算法基础,也是保证细胞排序准确的前提。本文使用的单细胞测序数据是大维稀疏矩阵,并且基因表达数据有着从10-6到10 2的量级跨度,这增加了分析的难度,并对算法的适用性提出了挑战。为了解决这个问题,我们需要先对数据进行清洗、归一化和降维。首先,本文利用dpFeature进行基因的特征选择,删除对分化过程作用甚微的基因;为了消除数据的量级跨度,对数据进行对数归一化处理;最后,为了消除数据噪声和方便数据可视化,并且基于基因数据的特点和结构,我们选择修正的局部线形嵌入(Modified Locally Linear Embedding,简称MLLE)降维方法对数据降维。在细胞排序部分,本文先是提出了一种动态半径近邻方法寻找cell-marker并对细胞集群进行聚类;再利用cell-marker构建最小生成树描绘细胞分化轨迹的整体分支框架;最后本文提出了一种基于Apollonius圆的新的细胞伪时间计算方法对细胞进行排序。在验证部分,将本方法应用于人胚胎干细胞数据集和小鼠胚胎单细胞数据集,将实证结果的预测轨迹与实验室分化轨迹结果进行Spearman相关性分析,分别得到了0.872和0.894较好的结果。
其他文献
寄宿制学校的学生处于身心发展的关键时期,适应寄宿制学校的文化生活是其取得良好教育效果和学生身心健康发展的关键。因此,处理好寄宿学生的文化适应问题是提高学生的校园文
<正>自2009年奥巴马出任美国总统以来,美国政府的核心关切逐步由"反恐"转变为"重振经济"。冷战后经济增长强劲、最具活力的亚太地区上升为美国全球战略新的重心。美国的亚太
<正>2011年以来,全球性通货膨胀形势持续发展,成为影响世界经济复苏和稳定运行的最大风险。全球性通货膨胀的出现与美西方国家奉行宽松货币政策有关系,有全球经济长期以来的
社会转型期的背景下,传统学校道德教育表现出越来越多的不适应性,如何正视学校道德教育的低效现象,剖析其问题所在是当前德育工作者迫切需要做的。本文试图从分析当前我国学
提出一种基于图像处理审查论文格式的方法,该方法依据论文电子版文档图像像素点间的相关性,应用马尔科夫链模型分割文档图像为正文、标题和图片部分,在人工设定的论文格式规
本文对硝基萘还原工艺的改进进行了研究,提出了还原反应的半间歇法。研究结果表明:本法海波液中硫化钠余量明显减少,反应时间大大缩短,产品收率比间歇法也有所提高。文中对半
文章选择四位毕业半年的硕士进行质性个案叙事研究,探讨生命德育中"如何与自己相处"的议题。分别追问"我是谁""我在意什么"和"我需要什么环境",讨论个体自我意识的获得、如何
为研究城市公路交通对路边土壤重金属污染的影响,以北京市西三环主要立交桥路段为研究样区,采用火焰原子吸收光谱法,对土壤中重金属Ni,Cr,Pb,Cu,Zn,Cd的含量进行了测定,并采
结合高校机械制造及其自动化专业的人才培养要求,分析了在专业教学中实施基于问题学习的教学模式的特点、给出了该种教学模式的方法、教学手段和考核方法,并在实践中进行了实
本科人才培养方案是高等学校实现人才培养目标和质量规格要求的总体计划实施方案,为使培养目标适应社会发展的需求,人才培养方案要不断的强调拓宽专业基础学科的范围和基础教