基于机器学习及复杂网络模型的缺血性卒中后焦虑抑郁状态危险因素分析及预测研究

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:kongct_2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:缺血性卒中具有较高的发病率及致残率,是危害中老年人身体健康的重要疾病之一。缺血性卒中不仅表现为躯体性障碍,也会导致患者出现情绪障碍。有研究指出约20%-50%的缺血性卒中患者出现情绪障碍,给患者及家属带来巨大痛苦。其中,卒中后情绪障碍以卒中后焦虑状态(post-stroke anxiety,PSA)和卒中后抑郁状态(post-stroke depression,PSD)最常见,目前主要依赖相关量表进行评估及诊断,但评估过程复杂耗时,且需要患者及家属的积极配合,在实际临床中存在一定的局限。因此,目前亟需有效便捷的卒中后焦虑抑郁状态预测分析手段。随着科学的不断进步,人工智能和大数据技术的蓬勃发展也给医学领域带来了巨大变革,如计算机辅助阅片、机器人微创手术等应用成果为繁重的临床工作提供了许多便利。机器学习和复杂网络模型作为人工智能应用的核心,在其中发挥了重要的作用。因此本文采用医学大数据与人工智能相结合的方式,通过机器学习模型对卒中后焦虑抑郁状态进行预测,并借助复杂网络模型分析导致卒中后焦虑抑郁状态的重要因素,通过重要因素对机器学习预测模型进行优化,最终获得减少输入因素且能准确预测缺血性卒中后焦虑抑郁状态的机器学习预测模型,为临床评估及干预提供有力的依据及科学指导。研究方法:连续性纳入2017年5月至2021年12月于中国医科大学附属第一医院神经内科收治的符合纳入与排除标准的缺血性卒中患者416例,入院24小时内记录患者的性别、年龄等人口统计学数据;吸烟史、饮酒史等病史资料;收集入院后次日清晨的空腹化验如血常规、肝功、肾功等化验指标;收集患者颅脑磁共振或颅脑CT影像学资料,入院24小时内用NIHSS评分评估卒中的严重程度。首先在发病10-14天时用医院焦虑抑郁量表-焦虑亚量表(Hospital Anxiety and Depression Scale-Anxiety Scale,HADS-A)、汉密尔顿焦虑量表(Hamilton Anxiety Scale,HAMA)以及焦虑自评量表(Self-Rating Anxiety Scale,SAS)共3个量表评估患者焦虑状态及程度,用汉密尔顿抑郁量表(Hamilton Depression Rating Scale,HAMD)评估患者抑郁状态及程度,并分别根据各量表对患者是否患有卒中后焦虑或抑郁状态进行标记,基于随机森林、支持向量机、决策树、随机梯度下降和多层感知机5种机器学习模型进行有监督的训练,选取AUC、欧几里得距离、均方根误差、均方误差分别评价5种机器学习模型预测效果;然后通过复杂网络模型计算出卒中后焦虑抑郁状态的危险因素,与传统统计学方法分析出的危险因素进行对比,并对危险因素重要性进行排序,筛选出适用于输入机器学习预测模型的重要危险因素,输入到机器学习预测模型,最后对机器学习预测模型进行验证及优化。结果:1.5种机器学习预测模型的结果(1)在PSA基于27项危险因素的定性分析中,随机森林模型的准确率最高,基于HADS-A、HAMA、SAS量表的AUC结果分别为0.71、0.67和0.65;(2)在PSA基于27项危险因素的定量分析中,基于HADS-A量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为14.4879、2.2486和25.2953),基于HAMA量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为20.3966、3.1670和50.2419),基于SAS量表进行预测时随机森林模型的平均欧几里得距离、均方根误差、均方误差最小(分别为35.4597、5.5170和173.7589);(3)在PSD基于27项危险因素的定性分析中,随机森林模型的准确率最高,AUC结果约为0.69;(4)在PSD基于27项危险因素的定量分析中,随机森林模型的平均欧几里得距离最小(13.5859)、平均均方根误差最小(2.1074)、平均均方误差最小(22.5611)。2.复杂网络模型分析卒中后焦虑抑郁状态的结果a.卒中后焦虑抑郁状态重要因素分析(1)复杂网络模型分析出的危险因素与传统统计学方法所得结果一致,而复杂网络模型进一步分析显示,卒中后焦虑状态的重要因素依次为高血压病史、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史和低水平的高密度脂蛋白;(2)复杂网络模型分析出的危险因素与传统统计学方法所得结果一致,而复杂网络模型进一步分析显示,卒中后抑郁状态的重要因素依次为非轻型卒中(NIHSS评分>4分)、糖尿病病史、饮酒史和高血压病史;(3)复杂网络模型分析显示,可导致卒中后焦虑或抑郁状态的重要危险因素依次为高血压、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史、C-反应蛋白、高密度脂蛋白、空腹葡萄糖和甘油三酯。b.基于复杂网络模型分析出的重要危险因素对已获得的机器学习模型优化训练结果(1)基于复杂网络模型分析的重要危险因素进行卒中后焦虑状态的机器学习模型预测结果显示,随机森林模型效果最好,且基于HADS-A量表的AUC提升至0.75,基于HAMA量表的AUC提升至0.81,基于SAS量表的AUC提升至0.72。(2)基于复杂网络模型分析的重要危险因素进行卒中后抑郁状态的机器学习模型预测结果显示,随机森林模型效果最好,AUC提升至0.70。(3)无论是基于全部因素还是复杂网络模型分析出的重要危险因素,对机器模型进行6)折交叉验证,随着6)值的增加,卒中后焦虑抑郁状态的预测准确率均随之提升。结论:1.机器学习模型可用于卒中后焦虑或抑郁状态的预测,在5种机器学习模型中,以随机森林模型预测效果最好,优于支持向量机、决策树、随机梯度下降和多层感知机;2.高血压病史、饮酒史、非轻型卒中(NIHSS评分>4分)、糖尿病病史和低水平的高密度脂蛋白是急性缺血性卒中患者出现焦虑状态的危险因素;3.非轻型卒中(NIHSS评分>4分)、糖尿病病史,饮酒史和高血压病史是急性缺血性卒中患者出现抑郁状态的危险因素;4.复杂网络模型可计算出卒中后焦虑抑郁状态危险因素并将重要性量化及排序,根据计算出的危险因素可对机器学习预测模型进行优化,准确率有所提升。
其他文献
背景:男男性行为人群(Men who have sex with men,MSM)的艾滋病毒(Human immunodeficiency virus,HIV)感染风险是一般人群的25倍,是国内外HIV疫情防控的重点群体。为全力控制MSM中HIV的流行,暴露前预防用药(Pre-exposure prophylaxis,PrEP)被广泛应用于降低阴性群体的HIV感染风险。但在PrEP使用中停药行为十
学位
目的:椎间盘退变(intervertebral disc degeneration,IDD)是各类脊柱退行相关性疾病的病理基础,目前退变相关的发病机制仍未阐明,在椎间盘的研究中常以髓核细胞做为研究基础,在影响间盘退变的因素中最首要的因素为髓核细胞发生退变,从而引起相关病理机制的改变,目前越来越多的研究中发现微小RNA(micro RNAs,miRNAs)可对髓核细胞进行调控,引起相关信号通路的改变
学位
目的:自然杀伤(NK)细胞是先天免疫系统的效应细胞,可在没有预先致敏或识别呈递抗原的情况下快速杀伤癌细胞或病毒感染的细胞,NK细胞亦可产生众多细胞因子,包括干扰素-γ(IFN-γ),肿瘤坏死因子(TNF-α)等,从而发挥抗病毒、抗肿瘤的能力。NK细胞发挥效应功能与否主要取决于细胞表面免疫调控受体(包括活化性受体与抑制性受体)之间信号的动态平衡。目前,关于NK细胞免疫调控受体的研究已逐渐受到广泛的重
学位
目的人类获得性免疫缺陷综合征是一种危害极大的传染病,其主要的病原体是HIV-1型病毒,目前仍在全球广泛流行,HIV感染者的新发病例数逐年上升,目前全世界仍有超过3800万的病例数,艾滋病仍然是严重威胁人类健康的世界重大公共卫生问题。HIV病毒主要攻击处于免疫调控核心地位的CD4+T细胞及树突状细胞、单核/巨噬细胞和其他免疫细胞,最终造成机体免疫系统的全面崩溃,由于机体抵抗力极度低下,会造成身体多重
学位
背景:胶质瘤是最广泛和恶性最高的原发性成人颅脑肿瘤,致死率大约为30%。尽管手术切除结合术后放化疗已成为常规治疗方案,预后依然不容乐观。胶质母细胞瘤(GBM,最具侵袭性的胶质瘤)的中位生存时间仅为14个月。尽管已有若干研究揭示了与胶质瘤恶性表型相关的分子机制,并开发了若干潜在治疗靶点,参与促肿瘤生长和侵袭转移等表型的尚未完全阐明。系统性的探索肿瘤相关的分子机制有利于鉴定肿瘤的生物驱动因子并且为胶质
学位
随着农村产权制度改革的深入,全国各地陆续完成农村集体资产的清产核资、折股量化、成立股份经济合作社。改革取得了初步成效,但农村股份制改革后成立的股份经济合作社股权结构设置与股利分配政策问题比较突出。文章通过实地调查法以浙江省义乌市A村为例,分析出该村的股权结构设置与股利分配政策方面存在股权配置平均化导致股权结构分散与股利分配政策有待改进的问题,并提出差异化配股、选择合适的股利分配政策等优化对策,以促
期刊
目的:对大面积骨缺损进行修复一直是临床上难以解决的问题。自体骨移植虽然常用,但供区损伤较大。骨组织工程概念于1995年提出,即应用工程学技术,首先制备具有良好性能的支架材料,然后将细胞负载到支架上,最后将负载细胞的支架材料种植到骨缺损部位,对骨缺损进行修复。近年来,很多研究着眼于骨髓间充质干细胞(bone marrow mesenchymal stem cells,BMSCs)的成骨分化机制,但B
学位
目的:甲状腺癌是发病率最高的内分泌系统肿瘤,近来发病率明显上升,约95%以上的甲状腺癌病理类型为高分化的分化型甲状腺癌(Differentiated thyroid carcinoma,DTC),乳头状癌(Papillary thyroid carcinoma,PTC)为DTC中最常见。绝大多数PTC患者经过早期发现及规范手术,术后进行TSH抑制治疗,并视病情辅予放射性碘等治疗预后通常较好,但仍有
学位
目的:肿瘤代谢重编程(Energy metabolism reprogramming)是肿瘤的特征之一,也是近年肿瘤研究热点。代谢途径在物种间高度保守,而代谢酶以复杂的方式动态变化,编码代谢酶的基因的改变是肿瘤代谢重编程的重要机制之一。肿瘤细胞内,代谢酶基因常常发生突变或扩增进而改变代谢物的水平,通过其“经典”酶促功能加速癌细胞的增殖;除此之外,多种代谢酶还表现出多样的“非经典”功能。明确代谢酶在
学位
背景:肺腺癌(lung adenocarcinoma,LUAD)是肺癌中最常见的组织学类型。Ephrin受体A10(Ephrin receptor A10,EphA10)是酪氨酸激酶受体家族成员之一,已报道参与肿瘤的进展,但其在LUAD中的作用仍不清楚。研究方法:采用免疫组化染色和实时聚合酶链式反应(Real-time polymerase chain reaction,Real-time PCR
学位