【摘 要】
:
目的通过超高效液相色谱-质谱联用技术(UPLC-HRMS)检测损伤后骨骼肌的代谢轮廓,分析骨骼肌代谢物随损伤时间的变化规律;在此基础上,运用Logistic回归(LR)、支持向量机(SVM)、随机森林(RF)以及多层感知机(MLP)四种机器学习算法建立数学模型用于损伤时间的预测,通过多个数学模型的串联,建立更为精确的骨骼肌损伤时间推断模型。方法实验选取7-8周龄,重约200-250g的雄性SD大鼠
【基金项目】
:
国家自然科学基金“国家自然基金青年项目,肌肉代谢特征谱结合人工神经网络技术在损伤时间推断中的应用研究(编号:81901924)”; 山西省应用基础研究项目,液质联用技术用于肌肉损伤时间推断的法医学研究(编号:201801D221264);
论文部分内容阅读
目的通过超高效液相色谱-质谱联用技术(UPLC-HRMS)检测损伤后骨骼肌的代谢轮廓,分析骨骼肌代谢物随损伤时间的变化规律;在此基础上,运用Logistic回归(LR)、支持向量机(SVM)、随机森林(RF)以及多层感知机(MLP)四种机器学习算法建立数学模型用于损伤时间的预测,通过多个数学模型的串联,建立更为精确的骨骼肌损伤时间推断模型。方法实验选取7-8周龄,重约200-250g的雄性SD大鼠共计117只,随机分为对照组、损伤组(损伤时间设定为4~48h,每隔4小时设置一组,共12个损伤时间组),每组9只大鼠,在预设时间点进行骨骼肌挫伤模型造模。利用UPLC-HRMS分析骨骼肌样品中的代谢谱,以OPLS-DA模型VIP>1以及FDR-adjust P<0.05为依据从代谢谱数据中筛选差异变量,并将各差异变量的精确质量数、二级谱图与mz Cloud数据库中标准谱图对差异变量进行鉴定。将差异代谢物信息导入到Metaboanalyst 5.0以及Cytoscape等在线数据库或软件进行代谢通路相关分析。而后经鉴定的差异代谢物数据进行机器学习模型构建。由于本实验采集的损伤时间点较多,用单一的数学模型难以将这些时间点区分开,因此在建模过程中,首先将4-48h之间的12个时间点大致的划分为3个大的时间段(第一层),再进行二次建模将大的时间段中的各个时间点进行区分(第二层)。最后通过Python软件将两级模型串联,从而实现串联机器学习模型的构建。先用OPLS-DA模型确定第一层时间段标签,而后运用4种机器学习模型通过交叉验证分别建立损伤时间推断模型,选取准确率最高的模型作为最终的第一层损伤时间推断模型;而后再次运用OPLS-DA模型在第一层时间段标签的基础上确定构建第二层时间段标签,经过交叉验证,同样选取准确率最高的模型作为最终的第二层损伤时间段推断模型。而后将上述搭建的两层模型串联,第一层模型可以输出样本的第一层时间段标签,而第二层模型可以输出样本的第二层时间段标签。最后再另选取13只大鼠挫伤骨骼肌代谢数据作为外部验证数据集以评估最终串联模型用于损伤时间推断的性能。结果通过代谢组学分析,从挫伤骨骼肌中共鉴定出随损伤时间变化的43种差异代谢物,代谢物功能主要集中在初级胆汁酸合成、氨基酰-t RNA合成、苯丙氨酸,酪氨酸生物合成、不饱和脂肪酸生物合成、花生四烯酸代谢等方面。运用OPLS-DA模型,初步将第一层时间段确定为4-12h(groupⅠ),16-32h(groupⅡ),以及36-48h(groupⅢ),第二层时间段为4h、8h、12h、16-20h、24-32h、36-40h以及44-48h。通过四种机器算法对上述时间段进行交叉验证评估,在第一层时间段MLP模型验证准确率为93.9%,LR、SVM、RF的验证准确率分别为87.8%、81.8%及84.8%。在第二层时间段中,MLP模型验证结果均优于LR、SVM和RF模型,在MLP模型中可将groupⅠ分为4h、8h及12h,将groupⅡ分为16-20h及24-32h,将groupⅢ分为36-40h及44-48h,验证准确率分别达到了100%,92.8%,及90.9%。通过python语言编写串联模型代码实现第一层MLP与第二层MLP串联,用13个外部验证数据进行验证,得到串联模型的最终准确率为61.5%。结论在本研究中,共发现43种可用于骨骼肌损伤时间推断的小分子代谢物,以此为基础建立了用于损伤时间推断的MLP-MLP串联机器学习数学预测模型,模型外部验证准确率达61.5%。本研究通过python软件自编代码将两层机器学习模型串联,将损伤时间推断的时间窗缩短至4小时,为动物数据应用于法医实践工作提供了一个有效的解决途径。
其他文献
目的:本研究基于我国慢性病患者的人数不断增加,经济负担重,慢性病患者专业照顾者缺乏的现状,调查护士教练培训内容的需求,在此基础上构建适合我国护士知识、经验、水平等特点的培训课程内容,为我国各地护士教练的培养及护士角色的发展提供参考依据。方法:本研究先用文献回顾法初步形成了我国护士教练培训课程内容草案;再用半结构访谈的结果对草案进行了修订,形成了我国护士教练培训课程内容指标体系的专家咨询问卷;最后借
目的:本研究立足于高等护理教育中现存的本科护生职业发展路径教育滞后于日益增长的社会发展需要、护理人才输送方定位不明确问题,引入供给侧改革理念,旨在探索出与我国现有高等护理教育资源相匹配的本科护生职业发展路径教育方案,以优化护理人才培养路径,创新高等护理教育发展模式。方法:(1)横断面现状调查:采用便利抽样于2020年3月-2020年6月抽取山西省某高等医学院校本科护生实施问卷调查,了解本科护生职业
目的:采用16s rRNA扩增子测序技术结合机器学习算法,分析大鼠死后及尸体样本肠道微生物变化与死亡时间的关系,以此推断死亡时间(postmortem interval,PMI)。方法:大鼠样本:成年雄性健康Sprague-Dewley大鼠84只,体重250300g,腹腔注射致死量戊巴比妥(350mg/kg体重)处死大鼠,死后存放于16℃、相对湿度50%±5%条件的人工气候箱。于死后0 d、1 d
目的:筛选在头发DNA中与中国北方汉族个体年龄显著相关的DNA甲基化位点并构建年龄推断模型。方法:结合近年来研究结果及现有文献,筛选出21个可能与年龄相关的多组织通用的甲基化候选位点。基于SNaPshot技术,利用低年龄组和高年龄组的6个样本再次进行筛选,选择出10个峰型正常且具有年龄相关性的CpG位点用于构建多重甲基化SNaPshot分析方法。并对该体系进行种属特异性及灵敏度的检测。运用该方法检
目的:本研究旨在对前期基于中国汉族平原男性人群建立的9个CpG位点年龄推断模型在不同海拔地域、民族和不同性别人群中年龄推断的适用性进行验证及优化,以提升年龄推断的准确性和应用范围;分析检测体系的灵敏度,为实际案件检验提供数据支撑;比较Epi TYPER技术平台和焦磷酸测序检测DNA甲基化差异,探讨跨平台年龄推断模型计算方法研究。方法:1.将模型建立时选取的517份汉族男性样本分15~24岁、25~
目的:在法医学研究中,死亡时间推断(postmortem interval estimation,PMI推断)始终是重点和热点,微生物群落在尸体腐败过程中有巨大作用是毋庸置疑的。已经有研究表明,尸体腐败过程中的微生物群落演替规律可以用来估计尸体的死后时间。然而,现有的大多数研究都是针对暴露于空气中的尸体。而事实上,埋葬尸体在法医调查中是非常常见的。本研究以大鼠埋葬尸体作为研究对象,采用高通量测序技
目的:了解国外护理模拟教学引导者认证相关内容,结合国内护理模拟教学引导者发展现况,初步构建符合我国护理专业特点及教师自身知识经验特点的护理模拟教学引导者认证体系,为护理模拟教学引导者专业化发展提供参考依据。方法:本研究采用文献回顾法、半结构式访谈法、德尔菲专家咨询法、层次分析法和比例分配法构建护理模拟教学引导者认证体系,并确定各个指标的权重。通过NVivo 7.0质性资料分析软件、Excel 20
目的:1.建立大鼠血浆、组织脏器中士的宁(STR)及其代谢产物士的宁氮氧化物(SNO)的高效液相色谱串联质谱(HPLC-MS/MS)检测方法。2.建立士的宁和士的宁氮氧化物在雌雄大鼠体内的代谢动力学模型,研究其代谢动力学规律;研究士的宁和士的宁氮氧化物与服药时间的关系,建立士的宁服药时间的推断方法,为士的宁中毒案件的法医学鉴定提供实验依据。3.研究士的宁和士的宁氮氧化物在大鼠体内的分布规律,为士的
目的:利用精液特异性甲基化位点确证混合斑中精液的存在,同时利用精液特异性甲基化位点联合的SNP位点确证人群的多态性,并可利用这种多态性进行混合斑中精液供者的个体识别。方法:本课题先利用甲基化敏感型限制性内切酶法(MSRE)对基因组进行酶切,然后利用复合扩增技术(multiplex PCR)和单碱基延伸技术(SBE)对精液、唾液、血液、阴道分泌物特异性的甲基化位点和精液甲基化位点联合的SNP进行检测
目的:研究甲基苯丙胺(methamphetamine,METH)诱导的小鼠行为敏化中多巴胺D3受体(D3R)的调控作用和基因表达变化规律,探讨不同脑区各多巴胺受体亚型(D1R–D5R)基因表达特征及其在METH成瘾中的作用,为进一步阐明METH成瘾的分子生物学机制奠定基础。方法:(1)METH诱导小鼠行为敏化模型的建立:所有实验小鼠分为4组,即野生型小鼠盐水组(WT SA组),野生型小鼠METH组