基于机器学习的慢阻肺患者再入院预测和风险分类

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:dfg4g4354yh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
慢性阻塞性肺部疾病是一种常见的慢性疾病,发病率较高,严重损害国民健康,疾病负担重,成为影响我国经济社会发展的重大公共卫生问题之一。由于医疗质量、健康结果和财政问题,复发性、计划外再入院的问题,即一些病人出院后30天内返回医院,并且是因为相同或相关的情况再次入院,已成为全世界的一项挑战。预测频繁的、可预防的再入院和了解造成这种情况的因素是一个正在得到广泛研究的关键问题。慢阻肺患者再入院预测风险和风险分类有助于给医疗机构提供一些可靠的数据支持,便于辅助医疗机构更加合理、均衡地配置医疗资源,提高住院服务的利用率。患者也能够通过疾病预警和风险分层工作,及早预防,有效干预,能够有效提高人们的健康水平,同时减轻经济负担。为了应对日益增长的需求,本研究提供了一个框架,结合医疗领域的结构化和非结构化数据,开发慢阻肺患者再入院预测模型并进行患者特异性风险分类。具体工作如下。首先为了处理非结构化的文本数据,对电子病历的命名实体识别。定义实体类型,完成数据标注,然后构建了基于Bi LSTM-CRF命名实体识别模型,将文本的电子病历中的有效信息抽取出来。为了对比验证模型的效果,将Bi LSTM-CRF的识别结果与CRF对比。其次是慢阻肺患者再入院预测。将结构化的特征和病例文本中获取的特征合并和预处理后,使用逻辑回归、支持向量机、随机森林、XGBoost和BP神经网络构建预测模型并对比评估,发现XGBoost是各项指标表现最佳的模型。对XGBoost的预测因子进行分析,发现再入院风险最重要的5个预测因素是:住院时长、查尔森合并症指数、病程、白细胞、嗜酸性粒细胞。最后是慢阻肺患者再入院的风险分类。根据选择的XGBoost模型的预测概率,采用k-means聚类方法将患者分为五个不同的风险组,沿可信度由低到高的方向,逐渐从训练集中丢弃一组或者两组用于人工评估结果的数据,其余的样本则通过XGBoost模型预测,结果导致预测模型的性能逐渐增加。同时与等距分层方法相比,k-means能减少更多的的人工评估工作量。这一风险分层方法提供了医疗决策这辅助决策工具。
其他文献
管理平台将施工过程中的每个构件的工序实际开始与完成时间、人员、机械、材料、施工资料等与构件关联,形成完整电子档案从而后续可查。一旦发生问题可在管理平台上直接调取与该构件相关信息与资料,及时定位问题发生的位置、分析问题原因,从技术上实现工程质量的终身责任制,达到了提升施工效率的目的。
期刊
城市综合防灾多道防线的建设贯彻城市灾害防治的底线思维,满足建筑工程灾害抗御的刚性需求,提升城市灾后功能保障的韧性能力,是灾害治理的综合性理念,为城市综合防灾建设提供基本方向和理念指引。从概念构成、目标导向、作用效果、实施机制等方面深入分析城市防灾多道防线与综合防灾理念的多角度契合,梳理综合防灾多道防线建设、管理的关键问题。在控制性详细规划层面,提出综合防灾建设控制指引的定性、定量、定位、定界内容,
期刊
报纸
报纸
“功”是研究简单机械的关键概念,也是理解能量概念的基础。本文基于学生视角,对“功”的概念教学提出几个值得思考的问题,并予以分析、探讨,为教学设计提供参考。
期刊
报纸
新冠疫情以来,线上购物的中国消费者逐渐增多,在此环境下社交电商也实现了迅猛发展,消费者不仅根据售价做出购买决定,还会在社交平台中交流产品使用意见和学习产品信息,进而做出购买决定。许多品牌商也意识到其重要性,纷纷布局社交电商。如何在竞争的环境下,针对逐渐增多的社会学习消费者和不同的消费者学习情况,选择合适的运营策略,将是各个在社交电商中的企业所面临的挑战。另一方面,相关的研究只关注了垄断环境下企业考
学位
经过十多年的迅速发展,我国市场经济体制已经逐步迈向成熟。随着我国经济体制改革的深化,市场环境经历了翻天覆地的变化,企业市场势力也在随之变化。通过对国内外文献梳理,本文发现相关研究主要集中在市场势力的测度、单个行业市场势力对劳动份额、投资的影响等方面。这为本文分析企业市场势力演变及其对研发支出的影响留下了研究空间。本文构建了企业市场势力影响研发支出的作用机理,采用会计方法和生产函数法对企业成本加成率
学位
当今国际经济、科技、政治等发生深刻调整,世界正经历百年未有之大变局,不确定和复杂的环境动荡给企业的生存发展带来了极大的挑战。作为快速感知和响应环境动荡的组织敏捷有助于企业实现可持续的竞争优势,成为当前学术研究和企业实践关注的热点议题之一。鉴于信息技术(IT)尤其是作为新一代IT的数字技术对实现组织敏捷的关键作用,现有研究强调了企业CIO(首席信息官)与业务高管共享一致的认知、目标与行动等对促进组织
学位
作为库存管理研究的经典问题,报童问题常被广泛地应用于社会经济生活的多个领域当中。在传统的报童问题研究中,通常需要对需求做出统计假设,并在此基础上进行模型求解。而在实际的决策环境里,零售商往往难以掌握需求的分布信息,且市场需求并不总是能用某一个概率分布进行准确刻画。机器学习技术的日益成熟为跨学科融合研究提供了新的思路,许多在线算法被引入到经济管理研究领域,以帮助解决实际的管理决策问题。WAA算法是计
学位