基于LOESS回归加权的单细胞RNA-seq数据预处理算法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:richard8517742
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统RNA测序技术研究是从整体水平研究基因的功能以及基因结构,已经广泛应用于基础研究、临床诊断和药物研发等领域,但是传统的RNA-seq方法一般是对群体细胞的分析方法,所得到的实际是一群细胞基因表达的平均值,因此,常规转录组分析方法难以鉴别异质性群体中各种细胞亚群的转录组特征。单细胞RNA-seq(sc RNA-seq,单细胞转录组)技术使用优化的新一代测序技术从各个细胞中获取转录组学信息,可以从细胞水平更好的了解细胞的功能。但是随之而来的是单细胞RNA-seq通常表现出比来自大量细胞群的RNA-seq数据更高水平的噪声和更多的零,所以如何分析单细胞RNA-seq数据是一个面临着很严重的挑战。单细胞RNA-seq数据为我们提供了研究细胞异质性和在生物条件下差异表达的基因的机会,其中一些在细胞中表达量有显著变化的高变异基因对单细胞测序数据的下游分析有着关键的作用,本文提出一种基于LOESS回归加权的单细胞RNA-Seq数据预处理算法处理基因在细胞中的表达量数据,使高变化基因在整个分析过程中作用加强,达到基因软筛选与数据降噪的目的。进一步,我选取6组单细胞RNA-seq数据对算法进行测试,首先对生成的基因表达矩阵进行预处理,然后分析预处理对后续分析(可视化、聚类、差异表达分析)的影响,实验结果表明该算法有效提升了下游分析准确度,显示出良好应用价值。之后我们分析现在常用的单细胞RNA-seq降维和特征筛选算法对后续分析的影响,实验显示此方法较其他方法对后续分析有着较好的效果。在这里,我们使用新的预处理方法处理从乳腺癌基因工程中分离出来的768个CAF的单细胞数据,然后对它们进行无监督聚类、差异表达基因、分化轨迹等分析,最后我们经过分析找到了三个细胞亚类,使用monocle工具找到了两个细胞分化节点,将细胞分为了五个分化的状态,并且找到了在这些分化节点前后表达量显著变化的基因,这些结果让我们对肿瘤微环境有了进一步的认识。
其他文献
<正>我厂多年来一直存在着铍青铜带材零件在时效时的变形问题,我们总结了几种变形规律,碰找到了一些解决变形的方法,分述如下:一、不用夹具时效时零件的变形:1、经过整形的零
会议
语文教学中,文言文阅读,尤其文言传记阅读,对学生独立的思想、人格的建构,将起着重要的作用。本文从人才培养的高度,以教师自身的提升策略,科学指导学生策略,深刻阐述了文言
目的:建立气相色谱法(GC)测定盐酸阿比多尔中的丙酮、甲醇、乙醇、异丙醇、二氯甲烷和三氯甲烷6种有机溶剂残留量。方法:采用Thermo WAX气相色谱柱(30 m&#215;0.25 mm,0.25μ
写景游记文言文是初中文言教学的难点之一,它是中华儿女所独有的一种对山水文化思考模式和表达形式,体现了中华民族自古以来对待祖国山川河水的审美格局和理想状态。但是对于
目的观察唑来膦酸治疗类风湿关节炎继发骨质疏松症的临床效果。方法选取2016年1-12月北京市石景山医院收治的类风湿关节炎继发骨质疏松症患者300例为研究对象,采用掷硬币随机
1目的:观察玻璃酸钠关节腔注射配合口服蠲痹汤方治疗膝骨关节炎的临床疗效,探讨中药治疗膝骨关节炎的有效性和可行性。2方法:选择2018年7月~2019年8月经我院收治的非手术治疗
自从意识到细胞是生命体最基本的单位起,研究人员就一直试图根据细胞特征对细胞类型进行表征和分类,然而传统群体水平上的RNA-seq与基因芯片的分析忽略了组织细胞间的异质性,
背景:随着人们物质和文化生活条件的改善,冠心病和2型糖尿病的发生人数越来越多,冠心病合并2型糖尿病患者在临床实践中更为常见,分析急性心肌梗死合并2型糖尿病的临床特点,可望为临床预防、诊断和治疗提供科学依据。目的:探讨急性心肌梗死合并2型糖尿病患者的临床特征。方法:选取2016年12月至2019年12月期间,在襄阳市第一人民医院心血管内科住院的急性心肌梗死病人,共计564人。所有患者均已接受冠状动脉
工业作为一个国家(或地区)处在发展阶段的重要产业,对于加速推进经济进程起着不可替代的作用,当今世界发达国家无一不是通过工业化革命来达到经济快速发展的目的。本文通过工
进入5G时代的今天,人们获取知识的途径更加多元化,慕课、短视频、在线直播等,如何借以现代科技手段将传统的民间手工香包制作技艺得以传承,具有一定的实际意义,本文从端午手