基于医疗大数据及人工智能的糖尿病视网膜病变的预测模型研究

来源 :大连医科大学 | 被引量 : 0次 | 上传用户:liuyantong7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:基于医疗大数据,应用人工智能方法建立糖尿病视网膜病变(Diabetic retinopathy,DR)发生及进展的风险预测模型。方法:应用医渡云检索方法选取2010年10月1日至2021年10月1日大连市中心医院糖尿病专病库中的2型糖尿病(Type 2 diabetes mellitus,T2DM)患者进行DR发生及DR进展的回顾性队列研究。收集基线人群的一般资料和血清学指标,同时随访患者末次住院时DR的发生及进展情况。首先利用随机森林、XGBoost、支持向量机、K最近邻法及逻辑回归五种机器学习算法,构建DR发生的预测模型,然后使用Light GBM、XGBoost、随机森林、支持向量机、K最近邻法及逻辑回归六种机器学习算法构建DR进展的风险预测模型。通过受试者工作特征曲线下面积(Area under the curve,AUC)、精确度、敏感度、特异度等评估各模型的预测效能,挑选出预测DR发生及进展的最优模型并将其与既往研究构建的机器学习模型做效能对比。从最优模型中输出影响DR发生发展的风险因素重要性排序。选取社区随访3年(2011年至2014年)的REACTION数据库中的333例DR人群作为外部验证集,评估各模型对DR进展的预测效能。结果:1.本研究共纳入8019例T2DM患者,其中1692例在随访时发生了DR(26.74%)。研究结果显示:XGBoost预测模型的AUC值为0.889(95%CI 0.874-0.904),灵敏度为0.811(95%CI 0.726-0.933),特异度为0.803(95%CI 0.673-0.881),精确度为0.804(95%CI 0.724-0.849)。XGBoost模型的预测效能优于本研究及既往研究中构建的其他机器学习模型,提示XGBoost模型在DR风险预测中具有明显优势。2.根据XGBoost模型输出DR发生危险因素重要性排名,重要性评分排名前十位的指标是:糖化血红蛋白(398分)、糖尿病病程(200分)、年龄(170分)、空腹血糖(156分)、血尿酸(140分)、肾小球滤过率(104分)、γ-谷氨酰基转移酶(102分)、总胆固醇(100分)、低密度脂蛋白胆固醇(95分)、高密度脂蛋白胆固醇(95分)。3.本研究内部数据集共纳入2017例DR患者,其中341例在随访时时发生了DR进展(16.91%)。研究结果显示:Light GBM预测模型的AUC值为0.843(95%CI0.793-0.891),灵敏度为0.853(95%CI 0.768-0.933),特异度为0.732(95%CI 0.687-0.778),精确度为0.752(95%CI 0.713-0.795)。XGBoost预测模型的AUC值为0.837(95%CI 0.782-0.890),灵敏度为0.838(95%CI 0.746-0.918),特异度为0.750(95%CI 0.704-0.798),精确度为0.765(95%CI 0.723-0.807)。Light GBM模型与XGBoost模型在预测DR进展时表现优越且性能相当,提示应用优越的机器学习模型进行DR进展预测很有前景。4.根据Light GBM模型输出DR进展的危险因素重要性排名,重要性评分排名前十位的指标是:空腹血糖(306分)、糖化血红蛋白(244分)、体重指数(123分)、收缩压(123分)、舒张压(50分)、肾小球滤过率(50分)、血尿酸(48分)、糖尿病病程(47分)、高密度脂蛋白胆固醇(47分)、低密度脂蛋白胆固醇(43分)。5.本研究外部验证集共纳入333名DR患者,其中DR进展的患者有35人(10.51%)。研究结果显示:Light GBM预测模型的AUC值为0.671(95%CI 0.581-0.765),精确度为0.706(95%CI 0.661-0.754),特异度为0.725(95%CI 0.676-0.775),灵敏度为0.543(95%CI 0.375-0.714)。Light GBM模型在六种机器学习模型中性能表现最好,且特异度及精确度均大于70%,再次证明Light GBM模型对DR进展的预测性能良好。结论:1.XGBoost模型在预测DR发生风险时性能表现最优越。XGBoost模型确立了血尿酸、肾小球滤过率、γ-谷氨酰基转移酶作为预测DR患病风险的新指标。2.Light GBM模型在预测DR进展风险时性能表现最优越。Light GBM模型确立了体重指数、肾小球滤过率、血尿酸作为预测DR进展风险的新指标。
其他文献
湖南境内矿藏资源丰富,母岩母质繁多,其发育形成的旱土是重要的农林土壤资源。湖南也是“有色金属之乡”,因而土壤重金属污染问题相对突出。为系统了解不同母质发育旱地剖面土壤重金属镉(Cd)、汞(Hg)、砷(As)、铅(Pb)、铬(Cr)的含量与质量状况及其影响因素,以湖南省5种典型母质(板页岩风化物、第四纪红色黏土、花岗岩风化物、石灰岩风化物和紫色砂页岩风化物)发育的红壤和紫色土为研究对象,采用定位并按
学位
电子商务通常是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器或服务器应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。我国的电子商务起步于1993年,经历了初步发展阶段、高速增长阶段和纵深发展阶段。经过二十多年的发展,以北京、上海、广州等经济发达
学位
显著性目标检测旨在突出图像中的视觉显著区域,应用于各种计算机视觉任务。而目前的显著性目标检测中依然存在着多尺度、背景误判、前景误判以及边界复杂等诸多问题。为有效的解决这些问题,本文基于卷积神经网络与深度学习的方法对显著性目标检测进行研究,并设计端到端的全卷积网络,以提高对显著目标的检测性能。本文的研究内容包括以下三个部分。1.坐标注意力特征金字塔的显著性目标检测算法。相比传统提取特征的方法,基于全
学位
随着国家教育事业的不断发展,我国在校学生人数也呈现出逐年递增的趋势。而在小学校园里的学生属于未成年学生,其年龄小、身心发展上也不够成熟,容易成为学生伤害事故的受害人。目前我国教育安全立法还不足,专门针对解决校园学生伤害事故的法律法规也非常欠缺,校园归责原则适用还不够完善,校园伤害事故救济机制缺位。因此强化校园学生伤害事故的法律责任研究显得尤为必要,责任问题既是一个理论探究的问题,但是从实践层面上考
学位
互联网的迅猛发展之下,普及率节节攀升,不少行业都搭载互联网平台获得良好的发展,包括农产品电子商务在内,在这几年的发展势头非常强劲。从2010年起,国家开始不断地出台农产品电子商务的利好法规条例来促进整个行业的发展。惠阳区作为广东省农业大区,在农产品资源方面非常丰富,但是这些先天的资源性优势并未助力惠阳区农业产业升级转型。因此,本文对惠阳区农产品电子商务发展的情况进行了深入研究,以期助推惠阳区农业产
学位
汽车产业是对很多产业产品的集中,汽车产业的发展已经进入了一个平台期,汽车行业供应链管理对比其他行业已经实现了相对程度较高的精益管理。近几年汽车销量的下滑,对汽车行业供应链中的上下游企业增加了新的挑战,从而对供应链库存管理有了更高的要求。本文基于这样的背景,在学习且研究了国内外相关研究成果的基础上,并通过调查研究问卷收集了案例企业相关信息,通过介绍案例企业的项目管理情况来解释作为JIS供应商如何实现
学位
随着城市现代化建设的快速步伐,为应对机动车带来的巨大交通压力,高架桥应运而生并迅速发展。然而,由于缺乏规划设计和有效的管理,消极的桥下空间成为了“孤岛”,它们撕裂着城市的肌理、割裂城市整体景观。近年来,在我国城市发展由“增量”转入“存量”阶段后,国内各大城市的规划建设者逐渐把目光转向了桥下空间,北京、上海、广州、成都等地区涌现出了一系列优秀的桥下空间改造范例,然而令人遗憾的是,国内大多数相关实践依
学位
创新赋予企业力量,企业作为当代社会进步的主要力量,其蓬勃发展离不开创新的支持。党的十九届五中全会提出要坚持创新的重要地位,利用金融推进实体企业的创新,加快对创新科技的应用,坚持科技自立自强这一国家战略支撑。国家不断推出政策鼓励实体企业创新,实体企业纷纷响应国家号召。对于实体企业来说,资金是企业创新的关键要素,没有资金的创新道路注定走不通,企业的创新发展需要长期稳定的资金,在激烈的市场环境中,很多实
学位
文章基于ChatGPT这一人工智能产品及其所使用的核心技术,结合智能会计的本质与架构,探讨了ChatGPT及其核心技术模型在智能会计领域的应用场景,尤其是在智能会计核算、智能财务共享、智能财务决策、智能财务分析可视化和内部控制智能化等方面的具体应用方式与方法。本研究所得结论为ChatGPT及其所使用的Transformer模型架构、反馈学习机制等AI产品在智能会计中的应用奠定了理论与技术基础,也为
期刊
我国经济向高质量发展转型的过程中,面临着较为严峻的“脱实向虚”的问题,抗风险能力较弱的中小企业也表现出了较强的“脱实向虚”的趋向。然而中小企业作为经济发展的活力源泉,是我国经济体系中不容小觑的重要组成部分,促进中小企业“脱虚向实”的任务至关重要。供应链金融以真实的交易为背景,对产业链全流程中的参与主体进行金融支持,有可能促进中小企业“脱虚向实”的进程。本文通过对国内外文献进行梳理,并在详细的理论逻
学位