基于随机森林算法的心力衰竭预测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:strengthandhonor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济水平和教育水平飞速提升,人类健康意识也逐渐增强,更加关注自身的健康问题。而大数据时代的到来,使得机器学习、人工智能与医疗领域的联系日渐紧密,精准医疗这一新型医疗模式应运而生,力求疾病能够得到精准预测、精准诊疗和精准预后,但目前该技术还在全力研究中,尚未得到全面普及。心力衰竭作为高发率和高死亡率并存的重大疾病,前期多表现为各种心血管疾病,若是能够利用先进的科学技术,结合医生的专业知识和经验,对心力衰竭进行预测,及早预防、尽早治疗,避免病情恶化,将具有重要的现实意义。本文选取心力衰竭相关临床指标,首先,对数据进行描述统计分析,提取数据分布、数据相关性等基本信息,检验出样本存在异常数据,于是将研究重点放在数据预处理和分类器训练上。其次,运用多重填补技术,插补缺失值,改善数据质量,为训练分类器做准备。然后,通过分析随机森林、朴素贝叶斯、SVM等五种常用分类算法的理论优势,再对比基于本文数据的预测准确率,选用随机森林算法训练分类器,得出基于原始特征和根据特征重要性进行特征选择后的预测结果,并借助混淆矩阵、AUC值评价分类器的性能。最后,为进一步提高分类器预测准确度,采用网格搜索法、随机搜索法进行超参数优化,寻找参数的最佳组合,对比两种方法的提升效果,优化对心力衰竭的预测性能,为心力衰竭的预测和诊断提供一定的参考。研究结果表明,基于随机森林算法构建的分类器,AUC可达到0.9左右,表明该分类器具有良好的性能,基于特征重要性选择特征,加速算法收敛的同时提高了分类器准确度,进一步经过参数优化处理后,分类器性能得到不同程度的提升。召回率从最初的88%提升到92%.“患病”识别度最高达94%.其中,随机搜索法的性能更高,提升效果更好。因此,在一定程度上来说,该方法对医生决策患者是否患心力衰竭具有辅助性作用,同时也为疾病的诊断注入更多的科学性和时效性。
其他文献
近年来,移动互联网与大数据技术的高速发展加快了智能移动设备的普及,提高了文娱消费能力,促进了文娱产业数字化转型,在线视频行业呈现出了蓬勃的生命力,成为人们生活中的“必备品”。然而,在人口红利减弱的时代背景下,在线视频行业正面临着市场同行竞争激烈、产品同质化严重、获客成本变高、用户增长乏力等发展问题,用户成为各大视频网站的争夺焦点。因此,有效利用平台海量、无序的用户行为数据,研究挖掘用户需求和产品痛
学位
随着互联网逐步成熟、移动智能化设备日益普及,互联网社交逐渐走向了自媒体领域,网络平台中的视频数据呈爆发式的增长,导致用户不能精准的获得自己特别感兴趣的视频内容。面对丰富的网络信息资源,如何既快速又高效地帮助用户找到自己真正感兴趣的信息是如今讨论的热点问题,而建立视频点击率预测模型就是解决该问题的关键。视频点击率预测主要是在上下文有效信息的基础上,对用户点击某个视频的概率进行预测。由于各类先进的机器
学位
现代医疗作为政府最重视的民生保障,在互联网+的时代不断地进行着变革。传统的人工医疗渐渐地不能够满足行业的发展和人民的需求,因此医疗系统的信息化与数字化转型迫在眉睫。许多学者将医学数据与人工智能、机器学习模型相结合,建立了新兴的数字化医疗技术,辅助医生进行疾病诊断的同时,也大大节省了医疗行业的人力物力资源,这种双赢的局面使得互联网医疗技术成为不断发展的热点技术,为数字化医疗的发展带来更多更新的动力。
学位
基于案例分析,阐述现代信息技术在互联网背景下得到了明显的发展,在课程教学的应用实践,构建信息化平台、实践立体化教学、扩展互联网教学资源,从而促进课程教学多元化。
期刊
目前,我国几乎所有与大气污染相关的指标排放均排世界前列。大部分地区雾霾天气频繁,空气质量不容乐观。空气暴露污染可导致过敏性疾病发病率升高,其中过敏性鼻炎作为常见的非感染性炎症疾病,全球约有10%~20%的人口患有。且一旦患病,尚无法根治,对人群的身心健康造成极大的困扰。本文从两个方面对空气污染对过敏性鼻炎的影响进行了研究。首先,基于广义相加模型对空气污染物(PM2.5、PM10、O3、SO2、NO
学位
随着年轻一代逐渐成为餐饮行业消费的主力军,消费者在饮食方面的需求日趋多元化,加之餐饮业态本身的多样性,餐厅面临着房租高、人力成本高、食材成本高而毛利低的困境,这使得降低成本的问题变得越来越紧迫,而人力成本和食材成本往往与销量相关,因此精准预测菜品销量一直是餐厅关注的重点。由于在线评论反映了消费者的就餐体验,同时还是用户决定是否消费的一个重要因素,因此本文试图从细粒度的角度挖掘在线评论中的信息,进而
学位
随着汽车保有量的逐渐增加与自然灾害的频发,汽车保险的费率厘定更加受到保险公司的重视。中国银保监会2020年9月发布的指导意见中提出,加大车险改革力度,更加科学地厘定费率,使得车险价格与风险更加匹配。目前广义线性模型是车险纯保费费率厘定的主流方法,而随着大数据的发展,集成学习方法也被逐渐应用于车险纯保费计算当中。基于法国第三方责任车险的索赔数据集freMTPL2freq和freMTPL2sev,在考
学位
随着5G时代的到来,网络招聘已经成为了大家求职的主要途径。网络招聘信息能够直观地反映岗位的需求情况,对于大数据时代中应运而生的数据分析类岗位,在网络招聘中也表现出了高薪资、供不应求以及地区差异明显等特征。其中岗位薪资更是求职者所密切关心的问题。因此本文一共进行了数据分析类岗位需求和薪资影响因素两个方面的研究。数据分析类岗位需求数据分析方面,本文利用网络爬虫技术共获得招聘网站上12107条数据分析类
学位
大数据时代的到来,不断推动着互联网金融的飞速发展,进一步促使了各类P2P网贷平台的数量与日俱增,P2P网贷平台一方面降低了借贷者的融资门槛,更加高效便捷,极大地提高了资金利用效率。另一方面,由于互联网金融的虚拟性、隐蔽性,互联网欺诈的事件层出不穷,如何控制P2P网贷平台用户的信用风险成为当前风险领域的研究难题。同时,对于高维度且海量的用户数据,集成学习算法凭借着高精准性、高稳定性,为识别违约用户、
学位
物流车辆管理及调度优化是降低物流运输业务成本,稳步提高物流服务质量的核心,被称作第三利润源泉。合理高效组织物流运输,开展运输车辆及驾驶人员调度可提高车辆利用率,降低空载率,极大减少运输成本,已经得到各大物流企业和园区工业运输管理部门的高度重视。然而,迄今为止,实际生产中车辆调度组织严重依赖人工经验指导,国内外车辆管理及调度优化的研究存在解算效率低下和难以实际应用等问题。因此,亟需新技术,新方法的提
学位