基于集成学习的融合模型在血糖值预测中的应用研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:qz824zane
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会压力不断增大,人们的作息时间变得越来越不规律,许多人的饮食习惯非常不健康,这导致糖尿病未确诊患者数量与日俱增,给人们的身体健康带来了巨大隐患。以目前的医疗条件无法根治糖尿病,只有尽早发现和积极预防才能减缓糖尿病所带来的危害,但想要成批量得知体检人员的血糖值需要耗费大量人力物力。如果可以合理运用机器学习的集成学习方法来构建血糖值预测模型,对血糖值进行精准预测,医护人员就可以对血糖值高于正常水平的人员进行预警或治疗,从而减少人们患糖尿病的风险,同时也能够节省一大笔医疗开销。基于生理模型的血糖值预测研究中,容易受到个体差异和外界因素的影响。随着机器学习的快速发展,基于数据驱动的血糖值预测方法凸显出准确度高的优势。本文以机器学习中的集成学习模型为基础,利用LightGBM模型、XGBoost模型、Cat Boost模型、GBDT模型、线性回归模型以及Stacking模型融合的思想,结合机器学习的相关理论知识,对模型做出相应的改进和优化,构建血糖值预测的新模型,最后对预测结果进行对比分析。本文主要的研究工作如下:(1)对数据集进行预处理。由于数据集的维度较高,并且数据集中存在较多异常数据,因此在构建模型之前对数据集进行预处理十分关键。本文首先对数据集中的异常值、缺失值进行处理,对数据集进行One-Hot编码,然后对特征进行权重分析,最后将数据集划分为训练集和测试集。(2)构建参数优化后的LightGBM模型。提出经三种参数优化算法优化后的LightGBM模型,即HY-LightGBM模型(经贝叶斯超参数优化算法优化)、GA-LightGBM模型(经遗传算法优化)、RS-LightGBM模型(经随机搜索算法优化)对血糖值进行预测,最后根据均方误差(MSE)等评价指标对预测结果进行评估。实验结果表明在没有经过参数优化的情况下,LightGBM模型与XGBoost模型、Cat Boost模型、GBDT模型、线性回归模型相比有着明显的优势,经参数优化后的HY-LightGBM模型预测精度优于经其他参数优化算法优化后的LightGBM模型和其他回归预测模型。(3)构建基于Stacking模型融合思想的血糖值预测模型。将经过参数优化后的HY-LightGBM模型、RS-XGBoost模型、RS-Cat Boost模型作为融合模型第一层的基学习器,将GBDT模型、线性回归模型作为融合模型第二层的元学习器,组成融合模型,以提高预测精度。实验结果表明,基于Stacking构建的融合模型进一步提高了血糖值的预测精度,具有较好的拟合能力。
其他文献
传统鸡腿菇的采摘和加工主要靠人工劳作,其中不可食用的根部切削是整个加工流程最费时费力的一道流程,实现根部自动化切削是目前急需解决的关键问题,机器人的应用给解决这一问题提供了契机。因鸡腿菇自身较脆,采摘加工过程对机器人的核心-“控制器”要求较高;基于运动学位置误差控制对伺服驱动器要求较高,且机器人发生意外,不能及时做出响应,造成机器人损坏甚至对工作人员的生命安全产生威胁。基于动力学模型力矩误差控制,
动态多目标优化问题普遍存在于现实生活中,此类问题的目标函数和决策变量会随着环境的变化而改变,因此求解该问题的优化算法必须能够快速而又准确地跟踪变化的最优解。基于预测的动态多目标进化优化算法可以根据历史环境信息寻求变化规律,预测未来环境的变化情况,是一类积极响应环境变化的有效算法。因此,本文对预测方法进行研究,提出两种基于预测的动态多目标进化算法。主要研究内容如下:针对算法求解动态多目标优化问题时存
电力机车的故障类型中,因轴承异常温升导致的轴承失效故障是最常见的,轴承温度在一定程度上反应出了机车运行的状况。机车在运行途中,短时间内轴承产生不正常的升温,预示着轴承存在故障缺陷的可能,持续的轴承发热会降低机车轴承的使用寿命,轴承的维护周期势必会缩短,更换频率也会增加;若是轴承异常温升长时间不被发现,最为严重的情况会导致车轴发生断裂的重大机车事故,带来的人员伤亡和社会经济损失不可估量。所以针对轴承
手势识别相比于人脸识别、行为识别等更具有直观性和简洁性,因此手势识别广泛应用于人机交互中。为了进一步提升手势识别的综合性能,本文使用传统方法和深度学习方法分别进行特征提取,通过优化集成分类器来改善手势识别的分类效果,并开发了一个基于自制数据集的手势识别系统。论文主要包括以下几个方面:手势特征提取方法分为两类,一类是基于传统的手势特征提取方法,如Hu距、颜色直方图、梯度直方图和Hausdorff距离
随着经济、社会、城镇化进程的不断加快,促进了小城镇人口集中和产业聚集,也使得小城镇的土地利用发生了巨大变化,间接影响着区域的发展,尤其在土地资源紧张、人地关系矛盾突出、耕地锐减的形势下,合理科学地利用土地,可以有效促进社会经济的高质量发展。本文以河北省张家口市宣化区为例,深入分析了宣化区的土地利用类型和生态系统服务价值(Ecosystem Service Value,ESV)的空间分布特征,同时为
由于自动控制、网络技术及微电子技术的迅猛发展,市场上多种多样的智能传感器、智能控制芯片面世,网络化控制系统便成为工业自动化控制领域一个值得深究的热点问题。网络化控制系统具有资源共享、结构简单、可靠性和灵活性更高及可远程操控等优点。但是优点众多的网络化控制系统仍然也会存在一些难以解决的问题,由于所传输的信息都是在网络中进行传输,而网络带宽通常是有限的,这就不可避免地存在介质访问约束、数据丢包和量化等
随着深度学习在计算机视觉和自然语言处理领域的广泛应用,图像内容中文描述作为跨模态转换任务逐渐成为研究热点,它将计算机视觉和自然语言处理两大领域深度结合,不仅需要理解并提取图像的语义信息,还需要将其转换为文本描述语句。该任务能够理解并描述图像内容,其研究内容具有很高的研究意义和应用价值,可以应用于图文互搜、图像检索、图像标题生成、少儿教育等众多场景。本文使用目前流行的编码器-解码器网络结构,首先利用
一直以来,真空镀膜技术被广泛用于各行各业,而真空镀膜设备所包含的智能仪器仪表、硬件设备繁多且纷杂,故对于真空镀膜设备的控制基本上都是依靠经验丰富的工作人员的实际操作。然而,这样不仅耗费大量的人力,且控制效果往往不尽如人意,结果浪费了大量的膜卷基材,镀膜的均匀度也无法得到保证。这就需要设计出一套完整的可实现自动控制镀膜的真空镀膜设备控制系统,既可以大程度减少人力物力的浪费,也为进一步推动工业自动化领
受复杂系统高安全可靠性和可维护性需求的驱动,伴随新技术的快速发展,学术界和业界对反馈控制系统预测与健康管理(Prognostics and Health Management,PHM)领域的关注度日趋上升。具体到工程实际中控制任务具有时限性约束的反馈控制系统,在噪声、干扰和时变等多源不确定因素下,如何基于运行状态信息准确预测其剩余使用寿命(Remaining Useful Life,RUL),又如
近年来,工业控制系统(Industrial Control System,ICS)呈现层次化、异构化、分布式的特点,开放的分布式环境中关于ICS的安全问题不断发生。传统的访问控制技术在互联网安全防护领域已经取得了广泛的应用,但是在ICS多任务协作场景下存在细粒度访问控制力度不足、跨域访问控制安全性不强等问题。论文对工业控制系统访问控制相关属性进行研究,通过对传统访问控制模型进行改进,结合多属性决策