基于深度神经网络的天然产物高分辨质谱数据的识别技术

来源 :天津中医药大学 | 被引量 : 0次 | 上传用户:VIPT250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为加快中医药现代化、国际化的发展,实现多学科、跨行业的交流,需要拓展现代科技与传统中医药相融相通的深度与广度。因此,要加强系统生物学、大数据、人工智能等多学科前沿技术与中医药的深度交叉融合。“中药现代化”战略已经实施了25年,我国的中药产业也进入了快速发展的新时代,中药的药效物质、作用机制、质量控制、药代动力学及安全性等基础研究都得到了全面的开展。在众多研究中,物质基础一直是中药首先要解决的基本问题,由于药用植物化学成分复杂多变,质谱(Mass Spectrometer)分析成为最高效的研究手段。目前市场上的质谱仪虽然具有结构鉴定能力强大、灵敏度高、分析范围广、分析速度快、与色谱仪兼容性高等特点,但由于厂家众多,型号多样,实验室数据库通用性一直是困扰科研工作者的难题。近年来,随着人工智能浪潮的推进,利用深度神经网络实现对大量数据的学习和分析成为了机器学习领域的关键性技术。深度神经网络技术,以人工神经元为基础,构建出适用于不同任务的深度学习模型,可以从大量数据样本中学习其深层次的内在规律和表示形式,使其在某些任务中达到甚至超过人类的水平。建立基于深度神经网络技术的机器学习算法,可以为数据的自动化识别、数据库通用性匹配提供新的解决方案。受此启发,本文利用深层神经网络模型学习黄酮类和二苯甲酮类天然产物标准品的质谱数据的内在差别,建立了一种能够对黄酮类和二苯甲酮类天然产物进行区分的神经网络模型方法。黄酮类和二苯甲酮类化合物具有结构相似,分子量接近,质谱裂解途径相似等特点,采用高分辨数据计算及数据库检索时,往往出现错误率较高的情况。本文以黄酮类和二苯甲酮类化合物为研究对象,探索深度神经网络技术在化合物分类上面的自动识别方法。采用超高液相色谱-四级杆-静电场轨道阱质谱联用技术(UHPLC-Q-Orbitrap MS)对随机挑选的50个标准品进行分析,包括25个黄酮类化合物,25个二苯甲酮类化合物,结合响应面实验设计对液相色谱条件和质谱条件进行优化。最后得到的最优条件为:使用Waters ACQUITY UPLC HSS T3(2.1×100 mm,1.8μm)色谱柱分离,经乙腈-0.1%甲酸水梯度洗脱,流速0.2 m L·min-1,柱温30°C,毛细管温度200°C,辅助器加热温度400°C,正离子喷雾电压3.2 k V,负离子喷雾电压2.8k V。得到最优条件后,对133个标准品进行液相质谱分析,包括84个黄酮类化合物,49个二苯甲酮类化合物。将133个标准品的液相质谱数据通过Xcalibur 4.0软件分别提取44维样本信息,包括:正离子模式下的保留时间、母离子m/z和20个二级质谱碎片,负离子模式下的保留时间、1个母离子m/z和20个二级质谱碎片。正、负离子模式二级质谱碎片选择的标准为前20强。为了进行深度学习的建模分析,将各化合物在正负切换扫描模式下得到的保留时间、母离子、及二级质谱碎片拼接起来作为模型的输入特征。并且,采用了深度前馈神经网络对113个标准品的数据74个黄酮类化合物标准品,39个二苯甲酮类化合物标准品)进行训练和验证,让神经网络模型学习到区分两类化合物的能力。最后利用神经网络模型对未学习过的20个标准品数据(10个黄酮类化合物标准品,10个二苯甲酮类化合物标准品)进行分类性能的测试。为了给神经网络模型提供更好的输入特征,本文基于113个标准品数据,分别对32维(正、负离子模式下的母离子m/z和15个二级质谱碎片),42维(正、负离子模式下的母离子m/z和20个二级质谱碎片),44维(正、负离子模式下的保留时间、母离子m/z和20个二级质谱碎片)这三种情况进行了实验对比,得到了不同的输入特征维度的深度前馈神经网络模型。实验结果表明,42维的输入特征可以实现最高的分类准确率,在对20个标准品进行的测试中,可以实现80%的分类正确率。为了对深度学习神经网络模型进行进一步的验证,本文通过Compound Discoverer2.1软件对不同溶剂提取的两个采收时期的芒果叶样品进行了数据自动提取,共得到102个化合物的42维高分辨质谱数据,使用模型对其进行分类鉴定,共得到46个黄酮类化合物,26个二苯甲酮类化合物。通过mz Cloud数据库以及实验室自制标准品进行鉴定,确认出其中18个黄酮,12个二苯甲酮。其中,有10个黄酮类化合物是在芒果叶中首次被发现,而未鉴定出的28个黄酮和14个二苯甲酮可能为新化合物。上述结果提示本方法具有灵敏度高、准确性好、自动化程度高的特点,适用于中药新化合物的快速发现研究。综上所述,本文运用响应面法对色谱条件和质谱条件进行优化,使用UHPLC-Q-O rbitrap MS仪器对133个标准品进行分析并采集数据,运用深度神经网络技术建立快速区分黄酮类化合物和二苯甲酮类化合物的方法,准确率达到80%,基本验证该技术的可行性。此外,模型的准确率可以随着标准品数量的增多而不断提高,提示深度学习技术适用于中药复杂样品的快速鉴定。最后,我们通过对芒果叶不同提取物中化合物进行鉴定,确定了该技术在分析鉴定上具有很大的实用价值,对药用植化分离也具有一定的指导作用。
其他文献
近年来,随着移动互联网的快速发展,基于位置的服务(Location-Based Service,简称LBS)得到了广大用户的青睐。通过LBS应用,用户可以在兴趣点(Point of Interest,简称POI)签到、评论和分享内容。然而,随着LBS应用的发展,如何从海量数据中迅速、准确地获取符合用户偏好的兴趣点信息,已成为兴趣点服务商和用户共同关注的主要问题之一。本文研究了基于用户偏好的组合兴趣
目的:近年来,我国医患关系紧张的局势趋于平缓,但暴力伤医事件仍时常曝光于众。因此,兑现国家、省政府的医疗纠纷预防与处理条例,建立并完善良好的医疗纠纷处理机制,妥善解决医疗纠纷,调和医患关系,形成稳定、满意的就医氛围,是深化医药体制改革,实现伟大中国梦的必然要求。本文通过调查江苏省连云港市第三方调解机构(又称“医调委”)的基本情况,医患双方对第三方调解的认知水平以及医方、患方、政府相关部门对第三方调
艺术创作,是一种复杂的精神活动和生产活动,它既包括对社会生活的观察、体验和审美认识方面,又包含运用物质媒介材料和技术手段进行物化方面。在这一精神活动过程中,灵感是许
黄芪(Astragalus Radix)为豆科植物蒙古黄芪Astragalus membranaceus(Fisch.)Bge.var.mongholicus Bge.Hsiao 或膜荚黄芪 Astragalus membranaceus(Fisch.)Bge.的干燥根。为常用的大宗中药材,素有“十方八芪”之说。子洲黄芪为近几年兴起的黄芪品牌商品,其独特的地理环境、特殊的种植、加工技术孕育了其优良
近年来,语料库翻译学的不断发展促进了语料库译者风格研究的发展。美国翻译家葛浩文(Howard Goldblatt)因翻译了诺贝尔文学奖得主莫言的多部作品而引起了中国译界的关注。在葛浩文译者风格的研究中,基于语料库方法的研究较少,且以单语类比的方式为主,缺少基于语料库的多重复合对比分析,也缺少针对副文本特征和译者风格的成因分析。本文以葛浩文以及其四部代表译作(1993-2014)为研究对象,采取了基
近年来男性不育的发病率呈不断上升趋势,五子衍宗丸是中医治疗少弱精子症的经典名方,在治疗男性不育方面具有广泛的临床应用,被誉为古今种子第一方。治疗男性不育、改善男性精子质量已成为亟需解决的社会问题。然而由于中药的多成分多靶点,五子衍宗丸的作用机制尚不明确,因此,本研究首先建立白消安致少弱精症的小鼠模型,给与模型动物五子衍宗丸,通过睾丸组织病理分析、精子质量和生育能力评价五子衍宗丸的生精作用,在此基础
盾构法隧道在施工过程中不可避免的会对隧道周围的地层造成扰动,打破地层原有的平衡状态,引起隧道上方地表沉降。地表沉降过大会对隧道周围的建筑物、地面道路以及地下管线等设施造成破坏,严重威胁人民群众的生命财产安全。本文以广州市轨道交通十二号线白云文化广场~云溪公园站区间盾构隧道为研究对象,对黏性土地层条件下盾构法隧道施工引起的地表沉降规律进行了相关研究,本文主要研究内容如下:(1)通过大量阅读关于盾构法
目的:观察索利那新联合硫辛酸治疗糖尿病神经源性膀胱(diabetic neurogenic bladder,DNB)患者并发膀胱过度活动症状(overactive bladder,OAB)的临床疗效及安全性。方法:选取糖尿病神经源性膀胱并发膀胱过度活动症状患者92例,随机分为对照组31例,索利那新组31例,索利那新联合硫辛酸组30例。对照组予以常规膀胱训练、血糖控制等一般治疗。索利那新组在一般治疗
研究目的:通过观察头针久留结合电针方案治疗脑小血管病步态及平衡障碍的临床疗效,以探索针灸治疗本病的合理方案,改善患者临床症状,提高临床疗效。研究方法:1.研究对象:根据本课题纳入标准,选取2018年9月至2019年12月期间就诊于天津中医药大学第一附属医院针灸科病房的患者作为研究对象,随机将入选病例分为观察组及对照组各24例。2.治疗方法:参照《脑小血管病诊治专家共识》对两组患者均根据个体差异进行
随着汽车行业的不断发展,汽车行驶的安全性问题也日益受到广泛关注。在汽车的安全驾驶方面,汽车轮毂质量的好坏起到了至关重要的作用。目前国内的铝合金轮毂制造多数采用铸造工艺,且大多为一体式铸造,成本相对较低,而且抗金属疲劳的能力很强。生产过程为先设计好的模具,再将融化的合金液浇铸进模具中。但由于其成型过程中受到冷却系统、工艺参数等因素的影响,容易产生内部缺陷,从而使产品的质量降低。在轮毂的全自动检测过程