论文部分内容阅读
目的:缺血性卒中具有较高的发病率及致残率,是危害中老年人身体健康的重要疾病之一。缺血性卒中不仅表现为躯体性障碍,也会导致患者出现情绪障碍。有研究指出约20%-50%的缺血性卒中患者出现情绪障碍,给患者及家属带来巨大痛苦。其中,卒中后情绪障碍以卒中后焦虑状态(post-stroke anxiety,PSA)和卒中后抑郁状态(post-stroke depression,PSD)最常见,目前主要依赖相关量表进行评估及诊断,但评估过程复杂耗时,且需要患者及家属的积极配合,在实际临床中存在一定的局限。因此,目前亟需有效便捷的卒中后焦虑抑郁状态预测分析手段。随着科学的不断进步,人工智能和大数据技术的蓬勃发展也给医学领域带来了巨大变革,如计算机辅助阅片、机器人微创手术等应用成果为繁重的临床工作提供了许多便利。机器学习和复杂网络模型作为人工智能应用的核心,在其中发挥了重要的作用。因此本文采用医学大数据与人工智能相结合的方式,通过机器学习模型对卒中后焦虑抑郁状态进行预测,并借助复杂网络模型分析导致卒中后焦虑抑郁状态的重要因素,通过重要因素对机器学习预测模型进行优化,最终获得减少输入因素且能准确预测缺血性卒中后焦虑抑郁状态的机器学习预测模型,为临床评估及干预提供有力的依据及科学指导。研究方法:连续性纳入2017年5月至2021年12月于中国医科大学附属第一医院神经内科收治的符合纳入与排除标准的缺血性卒中患者416例,入院24小时内记录患者的性别、年龄等人口统计学数据;吸烟史、饮酒史等病史资料;收集入院后次日清晨的空腹化验如血常规、肝功、肾功等化验指标;收集患者颅脑磁共振或颅脑CT影像学资料,入院24小时内用NIHSS评分评估卒中的严重程度。首先在发病10-14天时用医院焦虑抑郁量表-焦虑亚量表(Hospital Anxiety and Depression Scale-Anxiety Scale,HADS-A)、汉密尔顿焦虑量表(Hamilton Anxiety Scale,HAMA)以及焦虑自评量表(Self-Rating Anxiety Scale,SAS)共3个量表评估患者焦虑状态及程度,用汉密尔顿抑郁量表(Hamilton Depression Rating Scale,HAMD)评估患者抑郁状态及程度,并分别根据各量表对患者是否患有卒中后焦虑或抑郁状态进行标记,基于随机森林、支持向量机、决策树、随机梯度下降和多层感知机5种机器学习模型进行有监督的训练,选取AUC、欧几里得距离、均方根误差、均方误差分别评价5种机器学习模型预测效果;然后通过复杂网络模型计算出卒中后焦虑抑郁状态的危险因素,与传统统计学方法分析出的危险因素进行对比,并对危险因素重要性进行排序,筛选出适用于输入机器学习预测模型的重要危险因素,输入到机器学习预测模型,最后对机器学习预测模型进行验证及优化。结果:1.5种机器学习预测模型的结果(1)在PSA基于27项危险因素的定性分析中,随机森林模型的准确率最高,基于HADS-A、HAMA、SAS量表的AUC结果分别为0.71、0.67和0.65;(2)在PSA基于27项危险因素的定量分析中,基于HADS-A量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为14.4879、2.2486和25.2953),基于HAMA量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为20.3966、3.1670和50.2419),基于SAS量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为35.4597、5.5170和173.7589);(3)在PSD基于27项危险因素的定性分析中,随机森林模型的准确率最高,AUC结果约为0.69;(4)在PSD基于27项危险因素的定量分析中,随机森林模型的平均欧几里得距离最小(13.5859)、平均均方根误差最小(2.1074)、平均均方误差最小(22.5611)。2.复杂网络模型分析卒中后焦虑抑郁状态的结果a.卒中后焦虑抑郁状态重要因素分析(1)复杂网络模型分析出的危险因素与传统统计学方法所得结果一致,而复杂网络模型进一步分析显示,卒中后焦虑状态的重要因素依次为高血压病史、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史和低水平的高密度脂蛋白;(2)复杂网络模型分析出的危险因素与传统统计学方法所得结果一致,而复杂网络模型进一步分析显示,卒中后抑郁状态的重要因素依次为非轻型卒中(NIHSS评分>4分)、糖尿病病史、饮酒史和高血压病史;(3)复杂网络模型分析显示,可导致卒中后焦虑或抑郁状态的重要危险因素依次为高血压、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史、C-反应蛋白、高密度脂蛋白、空腹葡萄糖和甘油三酯。b.基于复杂网络模型分析出的重要危险因素对已获得的机器学习模型优化训练结果(1)基于复杂网络模型分析的重要危险因素进行卒中后焦虑状态的机器学习模型预测结果显示,随机森林模型效果最好,且基于HADS-A量表的AUC提升至0.75,基于HAMA量表的AUC提升至0.81,基于SAS量表的AUC提升至0.72。(2)基于复杂网络模型分析的重要危险因素进行卒中后抑郁状态的机器学习模型预测结果显示,随机森林模型效果最好,AUC提升至0.70。(3)无论是基于全部因素还是复杂网络模型分析出的重要危险因素,对机器模型进行6)折交叉验证,随着6)值的增加,卒中后焦虑抑郁状态的预测准确率均随之提升。结论:1.机器学习模型可用于卒中后焦虑或抑郁状态的预测,在5种机器学习模型中,以随机森林模型预测效果最好,优于支持向量机、决策树、随机梯度下降和多层感知机;2.高血压病史、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史和低水平的高密度脂蛋白是急性缺血性卒中患者出现焦虑状态的危险因素;3.非轻型卒中(NIHSS评分>4分)、糖尿病病史,饮酒史和高血压病史是急性缺血性卒中患者出现抑郁状态的危险因素;4.复杂网络模型可计算出卒中后焦虑抑郁状态危险因素并将重要性量化及排序,根据计算出的危险因素可对机器学习预测模型进行优化,准确率有所提升。