质谱特征识别和色谱保留时间预测方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wp76155900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢组学通过分析内源性代谢物种类和含量变化来获知生物体内已发生的生物学事件,在营养科学、精准医学和转化医学等多个领域有广泛应用。超高效液相色谱与高分辨质谱联用(UPLC-HRMS)技术是代谢组学的主要分析工具,可从生物样本中获得丰富的代谢物质谱信号。为了从中提取代谢物信息,首先要识别质谱特征,去除假阳性,减少假阴性,避免丢失低丰度代谢物,提升代谢物的识别覆盖度。其次,要将质谱特征定性为代谢物,以进行生物标志物筛选和代谢物的生物学功能等研究;仅依据质谱信息定性的结果假阳性高,色谱保留时间辅助有助于提高定性的准确度,但数据库中的大部分代谢物缺少保留时间。本文围绕上述问题,研究质谱特征识别和色谱保留时间预测方法,主要内容如下:(1)提出了一种基于信息熵和统计相关性的识别假阳性质谱特征的新方法。该方法首先定义了一种新的信息熵指标来度量提取离子色谱图的质量,研制了基于信息熵指标和统计相关性识别色谱峰谱图的算法,进而识别噪声和非样本源化合物的假阳性质谱特征。对于代谢物标样混合物的UPLC-HRMS数据,该方法去除了超过92%的假阳性质谱特征,同时保留了全部代谢物标样;对于尿样的UPLC-HRMS数据,该方法将质谱特征数量由7182显著地减少到2522,但保留了98%的定性代谢物。此外,在识别代谢物标样混合物和尿样的假阳性质谱特征中,该方法的性能优于RSD和MS-FLO方法的性能。这些结果表明,该方法能够有效去除假阳性质谱特征,保留代谢物质谱信息。(2)提出了一种基于质谱特征相似性图的提升代谢物识别覆盖度的新方法。该方法融合不同峰匹配方法识别的代谢物质谱特征,获取丰富的代谢物信息,建立质谱特征相似性图;通过搜索极大完全子图识别保留时间和质荷比空间上高度聚集的质谱特征,有效去除融合后的冗余信息。在实验中,对于包含41个低浓度代谢物标样的混合物的UPLC-HRMS数据,XCMS、MZmine 2和SIEVE三个峰匹配方法分别识别出19、19和27个代谢物,而本文方法识别出37个代谢物。对于稀释尿样的UPLC-HRMS数据,三个峰匹配方法识别出1360、2455和643个代谢物质谱特征,而本文方法识别出2960个代谢物质谱特征,包括991个低丰度质谱特征;进一步通过离子融合获得1619个代谢物。结果表明,该方法显著地提升代谢物的识别覆盖度,识别更多低丰度代谢物,具有很好的实际应用价值。(3)提出了一种基于加权预训练和迁移学习的化合物保留时间预测方法。该方法在预训练过程中采用互信息评价分子描述符中的特征与保留时间关系,强化分子描述符中的重要特征在损失函数中的作用,提高预训练性能,利用包含大量化合物保留时间的数据集建立高效的深度神经网络预测模型;然后通过迁移学习,利用目标色谱系统中已知化合物保留时间的小样本数据对模型微调,预测目标色谱系统中任意化合物的保留时间。在实验中,基于80038个化合物保留时间的SMRT数据建立深度神经网络,并将其迁移到14个不同的色谱系统,结果表明,在大多数情况下,本文方法的预测性能优于基于DNN、VW-SAE、AE-DNN和GNN-RT的迁移学习性能和机器学习算法RF,GB和LASSO的性能。该方法能有效解决只有少量化合物保留时间信息的不同色谱条件下的保留时间预测问题。133个代谢物标样的注释分析结果表明,该方法在质谱特征定性中具有很好的实际应用价值。
其他文献
随着我国的实体经济、科技水平、科技创新的不断发展,城镇土地资源的供给压力也不断增大,生态环境污染与资源枯竭问题越来越显著,全域国土综合整治的重要性也愈发显著。其中,低效用地整治是全域国土综合整治的重点内容,也是缓解土地供需矛盾,优化国土空间布局的重要途径。因此,为进一步达到土地集约化利用的目标,研究城镇低效用地的整治潜力,促进城市的建设用地有效挖潜,各地有序开展城镇低效用地再开发工作至关重要。本文
学位
积极稳妥推进碳达峰碳中和既是党的二十大报告明确提出的重点任务,又是应对全球气候变化的形势需要。深圳作为国家首批低碳试点城市之一,近年来在经济发展和控碳减碳双发展上取得了良好成效。文章从“双碳”治理视角出发,按照碳排放量波动一般性规律特征,对深圳40余年来统筹转型发展的“时”、调节节碳减碳的“度”、强化绿色发展的“效”的创新实践经验进行了分析梳理,认为推动绿色发展须将经济社会发展与“双碳”治理有机结
期刊
<正>楼宇经济是近年来城市发展中涌现出的一种新型经济形态,以商务楼宇、产业园区、产业功能区为主要载体。它将城市发展空间由平面拓展为立体,成为城市提升经济承载力和区域影响力的重要支柱。在山东,楼宇经济正持续释放活力,为经济高质量发展培育新动能。
期刊
中国城镇化进程已经步入中后期,城镇的扩张不再是发展的唯一主流形式。在经济新常态带来的经济增速“换挡”的宏观背景下,小城镇人口流失、经济衰退、各行业自身发展动力有限,从而产生了多种类型的低效用地,如何准确识别出低效用地并科学再利用成为了亟待解决的难题。富裕县富裕镇作为典型的东北地区收缩型小城镇,受人口结构变化、青年外出务工、经济结构转型、总规边界调整等多因素作用影响下,各类用地的利用效益都不断下降,
学位
目的 探讨2型糖尿病(T2DM)患者周围神经病变与骨密度的关系。方法 按照2011年中国骨质疏松诊断标准,300例T2DM患者分为骨量正常组(A组,113例)、骨量减少组(B组,102例)和骨质疏松组(C组,85例)。收集患者相关临床资料,计算肾小球滤过率(GFR)和胰岛素抵抗指数,测定双足震动感觉阈值,并分析T2DM患者发生骨质疏松的影响因素以及震动感觉阈值与临床指标的相关性。结果 与A组相比,
期刊
改革开放40多年来,我国城市呈现出“摊大饼”式向外扩张的特点,特别是经济快速发展的沿海城市生态承载日益逼近极限,对用地粗放式发展、低效率利用的问题一直没有从根本上得到解决,服务型政府可否以及如何推进低效用地再开发成为新的公共管理课题。2013年原国土资源部印发《关于开展城镇低效用地再开发试点指导意见的通知》,在江苏、浙江、福建等十个省(区、市)启动城镇低效用地再开发试点工作。江苏作为首批试点省份再
学位
<正>11月16日,中共金华市委办公室通报《"决战四季度、实现全年红"系列通报(一)——城镇低效用地再开发》,金华市婺城区2020年任务数400亩,完成870.65亩,完成率217.66%,居全市第一位。一是完善制度,高位推进。四套制度抓规范,从保障、管控、实施、实践四层面完善制度,规范低效用地再开发工作。建立了政府主导、高位推进的保障机制,通过联席会议、
期刊
<正>糖尿病周围神经病变(Diabetic peripheral neuropathy,DPN)是糖尿病高发的慢性并发症之一,发病率达50%[1]。早期DPN患者一般以对称性双侧肢体出现感觉异常为主要临床症状,后期可出现肢体疼痛与麻木等症状,远端比近端重,下肢一般比上肢重,且夜间疼痛症状加重[2]。临床一般将电生理检查作为确诊DPN的金标准,但由于该项检查无法精确观察患者神经形态等改变,且患者会感
期刊
锂离子电池中正极/电解液的界面特性对电池的输出能量和工作寿命有着不可忽视的作用,电解液的配方设计、正极材料表面改性和保护均可以改变界面结构,改善正极/电解液的界面相容性,最终提高锂离子电池综合性能。本文主要研究丁二腈电解液、正极材料表面结构重构以及掺杂包覆协同改性对正极/电解液界面和高电压下的电化学性能的影响规律,主要包括:(1)配制了一种腈类电解液,即1.0 mol/L LiBF4溶于丁二腈(S
学位
学位