基于电子病历的机器学习算法在心血管疾病预测方面的应用

来源 :武汉邮电科学研究院 | 被引量 : 2次 | 上传用户:fjiik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,医疗信息系统的不断完善和广泛应用,使得生物医学数据呈现爆发式的增长,诸如医学影像、电子病历、生物特征标记、临床登记记录等医学数据都具有潜在且十分重要的研究价值。但是基于统计学的医学研究方法受研究群体类别和规模的限制,并不能高效地开展针对大规模医疗信息的数据挖掘工作,而面向大数据的机器学习技术则可以有效地解决这一问题。因此本文引入机器学习技术,全方位、多层次地整合了电子病历中的数据信息,深入分析和挖掘了有用的临床特征,建立了高血压患者心血管疾病的发作风险预测模型,为临床上开展疾病预警工作提供了强有力的参考。主要研究内容包括以下几点:(1)针对深圳市卫生信息平台收集到的几十万高血压患者的电子病历,经过患者人群的筛选、数据的预处理、特征变量的构造及相应的统计分析后,使用XGBoost算法训练得到由53个特征变量构成的冠心病风险预测模型,该模型AUC为0.967,准确率为0.918。(2)将该模型与传统的弗雷明汉模型进行对比,证明了基于大数据和机器学习算法构建的风险评估模型在疾病预测方面具有更高的准确率和可靠性。之后又通过单因素变量分析实验发现,传统的风险因素和模型提取到的临床特征在预测疾病发生概率时都表现出了高度的非线性相关。(3)为了增强模型的可解释性,又从特征变量,样本数据量和不同建模方法三方面开展对比研究,进一步探究和讨论了影响模型性能的重要因素。
其他文献
目的:探讨以精神障碍为主要表现的低血糖病的病因,旨在早发现、早诊断。方法:回顾性分析35例以精神障碍为主要临床表现的老年低血糖病的诊治经过。结果:老年糖尿病伴发低血糖症
二十一世纪是世界贸易飞速发展的世纪,各个国家加速了与其他国家之间的交流,而今在一带一路的倡议下,中国面临对外贸易发展的新机遇和新局面,本文将从我国货运现状出发,分析"
近年来,随着产业结构的调整和果价优势的体现,我县果业生产迎来了又一个发展高峰,部分果农的栽果积极性高涨,但由于近年春季持续干旱。苗木栽植成活率极低,一定程度上制约了我县果业的发展,为此,笔者对此进行了多年的调查分析,基本摸清了成活率低的原因,并提出相应的对策,供广大果农参考。    1 栽檀成活率低的原因    1.1 苗木质量不高  调查表明,苗木根系发育好,缓苗期短,成活率高;根系发育差,干旱
自1978年改革开放以来,我国经历了高速经济增长,投资是支撑经济增长的重要驱动力。然而,长期过高的投资也产生了非效率投资问题,需要从微观层面研究如何抑制过度投资、提高投资效率。股东与经理之间和大股东与小股东之间的代理问题会导致非效率投资行为,公司治理机制是缓解公司的代理问题、有效抑制非效率投资的重要机制,代理问题、公司治理和投资效率这三者之间存在紧密联系。本文从理论方面基于代理成本中介效应视角探讨
葡萄开花结实后,果粒逐日增大,经过40~50天的发育,果粒膨大暂时停止,种皮渐渐变褐变硬,而果肉开始软化,这个时期称为硬核期,是果粒由体积急速增长向内涵物质充实的过渡期。这时期的栽
期刊
随着人工智能和机器学习的发展,各领域都逐渐步入智能化。作为一直以来受国家重视的医疗健康服务领域,它的智能化近年来更是受到了广泛的关注。如今的推荐系统在各个领域都有较为成功的应用,然而在医疗范畴的应用却仍需要进一步去挖掘。尽管医疗领域的推荐系统相比其他领域存在着更多的困难,即便如此国内外的学者们也从未停下探索的脚步。目前推荐系统在医疗行业较为成功的业务应用有:辅助诊疗、合理用药、就诊引导、精准医疗等
金融是现代经济的核心,它对经济的运行与社会制度的完善具有重要的促进作用。而风险管理是金融的本质之一,是所有金融业务的核心。随着民间金融行业的发展和金融科技浪潮的更
隔膜泵是氧化铝生产工艺中的核心设备,在氧化铝溶出系统中与赤泥外排过程中均承担着输送浆体的重要任务。针对氧化铝工艺中的浆体特点,提出了氧化铝用隔膜泵的注意事项,并阐述了
镁在人体中是继钠、钾、钙之后第4位阳离子,起调节细胞内外钠、钾、钙的重要作用。镁盐的导泻、利胆作用已被人们熟知。近年来,人们对镁的生理与药理作用的认识逐步深入,镁的临