基于数据挖掘的慢性病预测研究与应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:fjutjwzx4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国慢性病问题的日益突出,国家越来越重视慢性病的预防,战略前移,重心下移,从疾病发生的上游入手,对疾病发生的危险因素实行有效控制与管理。构建慢性病风险预测模型可以有效地发现疾病的潜在风险和趋势,从而对疾病进行管理、预防和干预。针对现实生活中,一个病人可能同时出现多种疾病的情况,本文基于深度学习构建多疾病风险预测模型,尽可能在预测时做出最全面、最准确的判断。多疾病风险预测,需要我们从众多危险因素中选择出较为主要的危险因素,使用较少特征达到满意的预测效果。本研究从数据挖掘的角度提出特征选择的方法对慢性病的主要危险因素进行分析。通过对三种基于树模型的集成学习算法RF、GBDT和XGBoost对比实验,选择其中分类效果最好、运行速度更快的XGBoost进行特征选择,经随机搜索对模型超参数调优后,使用平均增益指标gain对特征重要性度量,筛选出模型最重要特征,用常见慢性病验证基本准确,效果较好。并对其他主要危险因素进行了选择。本文采用问题转换的方法将多疾病预测问题转换为多标签分类问题,并用问题转换中LP方法将多标签数据集转换为多类数据集。根据二维医疗数据集中样本的一维特性,选择一维卷积神经网络构建模型。对三种慢性病经过特征选择筛选出的21、32、42、62个特征进行建模,将预测准确率最高的32个特征构建的模型保留,加载到基于Django框架构建的慢性病风险预测系统中,实现用户从前端进行疾病预测。针对目前医疗数据集普遍存在数据不平衡的现象,本文将焦点损失函数应用到疾病预测模型中去,尽管牺牲了未患病类别的准确率,但提高了我们更为关注类别的预测准确率,具有一定意义。
其他文献
医学图像配准是医学图像处理领域的关键技术,被广泛应用于病理跟踪、组织结构差异分析、手术导航等。虽然传统基于迭代优化的配准方法已日趋成熟,但存在配准时间长且容易陷入局部最优的问题,无法满足临床的实时性和准确性要求。随着深度学习技术在计算机视觉领域的广泛应用,利用深度学习技术研究医学图像配准已成为当前的研究热点。然而,目前大多数基于深度学习的配准模型主要关注非线性配准,而针对端到端的,即同时涵盖线性和
随着大数据产业的快速发展,人工智能领域被大众所关注,以电子文档形式存在的文本数据也与日俱增,这些海量的数据包含十分丰富的信息。若计算机能够从海量的文本数据中学习到人类语言的知识,就能够替代人类做许多复杂的任务,减轻人类的负担。文本蕴含任务是一项研究文本之间定向语义联系的任务,包含三种关系,蕴含、中立、矛盾,这些关系普遍存在于自然语言文本中。目前的研究方法主要建立在语义表征技术与语义推理技术两个核心
本文主要研究一类群体博弈的稳定性和在共享汽车中的应用.首先针对群体博弈,在有限理性条件下研究了群体博弈的逼近定理及通有收敛性.然后在有限理性框架下研究了稳定群体博弈的结构稳定性、鲁棒性以及逼近定理.最后,从演化博弈的角度,建立出行者群体演化博弈模型,分析影响共享汽车出行者出行方式选择的相关因素.具体研究内容如下:(1)针对群体博弈,首先在一定的假设条件下,证明了有限理性条件下群体博弈的逼近定理.然
卫星通信网络是现代通信网的重要组成部分,卫星通信网络的安全是卫星通信网络发展和研究的关键问题。本文研究的是以低轨卫星作为服务器为用户提供网络服务的通信场景。在此场景下,用户可以直接访问卫星获取的图像、位置等资源信息。由于低轨卫星具有高暴露、高时延、高动态变化的特点,导致低轨卫星网络比传统网络更易受到攻击,造成信息泄露、网络拥塞甚至使整个网络瘫痪。针对以上问题,本文提出了一种安全接入认证方式,确保用
随着新材料、计算机控制技术、功率电子器件日新月异的发展,加上永磁同步电机优异的控制性能,使得在工业控制中成为最热门的电机之一。基于磁场定向的矢量控制也成为各学者专家的研究对象。本文在矢量控制的基础上采用滑模控制策略,提出了新型趋近率,然后通过采样率对永磁同步电机的滑模控制性能进行研究。本文撰写的思路通过以下几个方面展开。首先在第一部分主要介绍与本文技术相关的发展现状。介绍了滑模控制的诸多控制策略,
随着我国经济飞速的发展,电力网络也进入高速发展的阶段,高压直流输电已经成为电力系统的重要组成部分。高压直流输电线路的绝缘性能与电力系统的安全可靠运行有直接的关系,其中高压直流电缆的绝缘属于非自恢复绝缘,绝缘中可能存在局部缺陷进而引起局部放电行为。局部放电作为评估电力设备绝缘性能好坏的有效手段之一,研究高压直流条件下局部放电的特征规律是很有必要的。首先,本文回顾了直流电压下电缆局部放电的国内外研究现
随着国家对于应急安全现代化治理能力要求的提升,完成企业安全生产管理信息化是其中重要的环节。近年来,全国各地的经济快速发展,生产经营类企业随之快速扩张,同时企业的安全生产问题也逐渐加重。目前,大多数企业还是以传统的管理方式进行安全生产管理,缺乏对企业整体安全管理状况的理性判断与在数据的支撑下对未来安全管理状况的有效预测,为了解决这一系列的问题并推动企业安全生产信息化建设,本文研究并实现了WEB端企业
为实现经济社会发展全面绿色转型,近二十年来,中国政府优化能源结构,在大力发展光伏、风能、生物质能等一系列新能源发电技术方面取得举世瞩目的成就,但就目前和未来一段相当长的时期,传统的以化石燃料为主的火力发电机组仍将在电能贡献方面扮演主要角色,煤电仍将占据电力生产市场的主要部分。煤炭是火力发电主要消耗的传统能源,国内经济的迅速发展致使我国对电力需求急剧提升,导致煤炭资源消耗巨大,严重造成环境污染。因此
近年来,我国新能源发展迅速,应用规模不断扩大,成本持续降低,消纳矛盾明显缓解,清洁替代作用日益显著。随着补贴逐步退坡及市场建设加快,我国新能源发展步入后补贴时代,未来将逐步成为主导电源。风电、光伏发电、水电等可再生能源既不排放污染物、也不排放温室气体,是天然的绿色能源。为实现这个目标我国必须推动能源转型的发展、应对温室效应及气候变化等问题,大力发展可再生能源的建设。然而可再生能源发电的波动性和随机
互联网技术以人们意想不到的速度发展,但随着技术的发展,对计算资源的需求剧增,程序可以通过算法的优化来提高速度,但最后的瓶颈还是归结到硬件资源上,这就导致某些小型企业、学校难以跟上硬件设施的迭代速度。再者,传统模式下,实验课进度经常被环境搭建所困扰或者由于系统环境不同导致老师不能运行学生的程序作业。虚拟化的出现,改变了资源的利用方式,实现了资源共享,容器化更加降低了应用服务对系统环境的依赖。将虚拟化