质谱代谢组学数据预处理中的缺失值填补和批次效应校正方法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:sukeyjuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
质谱技术以其高灵敏度、高通量以及高覆盖范围等特点,目前已广泛应用于非靶向和靶向代谢组学研究中,是筛选病理相关的潜在生物标志物和分子机制研究的一种有力工具。然而,由于生物样品的异质性和仪器设备的不稳定,质谱代谢组学数据在采集过程中往往存在许多干扰因素,如信号漂移、数据元素缺失、不必要的变异等。因此,在下游统计分析之前,通常需要对数据进行预处理,消除这些干扰因素对分析结果的不利影响。本文以质谱数据预处理步骤的缺失值填补与批次效应校正作为研究切入点,主要内容如下:一、本文分析讨论了质谱代谢组学数据中的缺失值问题,并提出了一种基于非负矩阵分解的缺失值填补方法。该方法对初始数据矩阵进行非负约束的因子分解,并对重构矩阵加权平均得到一个新的加权重构矩阵,最后将初始矩阵中缺失的元素用加权重构矩阵中的相应值填补。在模拟缺失数据中,本文引入归一化均方根误差、高斯图模型的F1 score和平均排序得分作为填补性能评价指标,充分讨论了不同缺失机制、比例以及异常值存在时,该方法与其他常见的缺失值填补方法的性能。结果表明,基于非负矩阵分解的填补方法相比其他方法具有更好的填补精度与鲁棒性,且在数据集存在异常值时依然表现稳健。二、本文提出了一种基于QC样本的线性回归批次效应校正方法。该方法先对不同批次的QC样本构建线性回归模型,再将模型参数迁移至目标样本中校正实测数据中由批次效应引起的漂移。与其他常见的校正方法相比,基于QC样本的线性回归方法不仅能够有效地抑制批次效应带来的离子峰丰度水平差异,而且能够更多地保留原始变量之间的相关关系。因此,该方法操作简便、计算量小且性能优异,可作为质谱代谢组学数据预处理步骤之一推广使用。
其他文献
自从甲胺铅碘钙钛矿材料被引入太阳能电池领域后,以ABX3型钙钛矿材料作为活性层的钙钛矿太阳能电池飞速发展,取得了瞩目的成就。在短短十一年内,钙钛矿太阳能电池的能量转换效率增速惊人,从最初的3.8%攀升至目前的25.5%。这是因为钙钛矿材料具有合适的带隙、较长的载流子扩散长度和较快的载流子迁移率,使得其应用在太阳能电池中时,器件具有较宽的吸光范围和较低的载流子复合。但现如今钙钛矿太阳能电池仍面临着许
学位
审计费用的影响因素涉及到各个方面,其中包括企业的竞争地位和面临的环境不确定性。当其竞争地位较高,能拥有诸多优势,使得自身经营风险因此被降低,造成注册会计师的诉讼风险随之降低的结果。当企业面临的环境不确定性增加时,由于客观环境的变化,会提高企业的经营风险,使得整体审计风险增加,即使是企业竞争地位高也不能避免环境不确定性增加带来的负面影响。基于上述分析,本文将我国2013-2019年A股上市企业当作研
学位
中国经济正处在经济新常态,力图突围“三期叠加”的大环境。全球经济形势长期波动,为实现“稳增长、调结构、促改革、防风险”的多目标,政府调控机制也处于不断积极应变之中,引发了政策不确定性。在此背景下,跨国并购已经逐渐替代绿地投资模式,成为各家企业快速拓宽领土和占领全球优质资源的主要模式。但是,在全球地缘政治冲突、贸易保护主义等诸多不确定下,中国企业的跨国并购在2016年突破历史峰值后,连续三年出现下降
学位
为获得容量高、循环稳定性强的锂离子电池负极,本文对SnS2材料进行了研究。论文的第一部分,采用溶剂热法制备了用微量石墨烯包覆的SnS2@GO复合材料,并用涂浆法制备了锂离子电池负极。测试结果表明,包覆的石墨烯提升了复合物的导电性,加快了电子传导速度,而且作为结构骨架缓冲了反应过程中活性材料的体积膨胀问题,能稳定电极结构,使得复合材料表现出比纯SnS2材料更为出色的电化学性能。经不同的大电流密度循环
学位
卷积神经网络作为人工智能的主要技术之一,已经成功应用于人脸识别、图像检测与识别、无人驾驶、医疗护理等诸多领域,为社会的发展做出了巨大的贡献。但卷积神经网络的运算速度与计算资源、内存资源庞大需求之间的矛盾限制其应用范围。随着万物互联与智能时代的到来,卷积神经网络的硬件加速优化设计已经成为了当前人工智能与数字集成电路设计领域的研究热点。针对卷积神经网络的全连接层,本文首先通过剪枝、量化等模型压缩技术,
学位
臭氧作为一种易被忽视的大气污染,以低浓度广泛存在于电子设备密度较高的现代密闭办公环境中,长期接触将对人体健康造成不可忽视的危害。催化分解法是一种经济有效的降解臭氧方法,其中,锰的氧化物是性能优异的臭氧分解催化剂。然而,在如较高湿度的实际应用场景中,氧化锰催化剂活性降低明显。本论文以石墨烯气凝胶作为基底,合成整体式的化锰石墨烯复合气凝胶用于臭氧降解。当前臭氧降解处理的研究集中于数百至上千ppm以上的
学位
作为连接现实世界与数字世界的桥梁,模数/数模转换器在现代技术体系中扮演着不可或缺的角色。目前,在无线通讯、手提电话、个人电脑、硬件存储等领域,相关的芯片设计在功耗、面积等方面有着很高的要求。这就推动了模数转换器芯片向着更低功耗、更小面积的方向发展。同时,根据奈奎斯特定律,输入的信号频率越高,模数转换器的采样率也要越高(Fs≥2*Fin)。也就是说,在保证更低功耗、更小面积的前提下,转换器的采样频率
学位
便携式、移动式智能电子设备对于电源的能量密度和柔韧性都要求越来越高,锂离子电池(LIBs)新型活性物质锡基材料如SnO2、SnS2等具有理论容量高、生产成本低、形貌可控性好等优点,然而导电性差、充电时体积膨胀,而且合成的结构一般为粉末状,用传统涂覆方法制备成电极时柔性较差而且引入大量的非活性材料,因此本文以高柔韧性的静电纺丝碳纤维膜为自支撑电极负载氧化锡或硫化锡,调控纳米结构和碳薄壳包覆方式,探讨
学位
锂硫电池的理论比能量密度高达2600 Wh kg-1,被认为是极具开发潜力的下一代高能量密度二次电池体系。单质硫作为正极材料,具有高理论比容量(1675 mAh g-1)、环境友好、价格低廉和储量丰富等优点,但同时也面临着诸多问题。首先,单质硫及其放电产物Li2S的导电性差,从而降低了活性物质的电化学反应性。其次,单质硫在充放电的过程中体积变化率可达到80%,会降低电极结构的稳定性。最后,充放电过
学位
基于深度学习的人脸对齐和人脸姿态估计作为人脸识别技术的重要环节获得了广泛的关注。人脸对齐是描述人脸形状,人脸姿态估计是描述人脸相对于摄像头的位置情况,两者都是描述人脸的重要任务。高精度的人脸对齐算法可以通过计算得到后续的人脸姿态角。在现有的人脸对齐算法中,不同的人脸关键点之间有着不同的收敛速度和定位难易程度。由于所有的关键点平等地训练,从而限制了定位的精度;对于损失函数,关键点之间的相对距离和方向
学位