基于数据挖掘的2型糖尿病患病风险预测模型研究

来源 :北京工业大学 | 被引量 : 6次 | 上传用户:weishuren33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖尿病是人体内胰岛素绝对或相对不足所导致的一组内分泌代谢性疾病群,其主要特征为血葡萄糖(简称血糖)水平增高,是目前世界上最主要的慢性非传染性疾病之一。当今全球范围内约有4.25亿人罹患糖尿病,其中2型糖尿病患者占90%以上。我国糖尿病患者人数居世界首位,且糖尿病及其相关并发症的发病情况逐渐呈现出爆发式增长趋势,极大地影响了居民的生活质量并威胁到整个社会的健康保健系统。目前糖尿病尚无根治方法,亟需构建科学有效的糖尿病风险预测模型以评估普通民众的糖尿病患病风险,察觉潜在高危人群,继而对糖尿病发病进行预告与预警。近年来国内外趋向借助日渐成熟的数据挖掘技术从庞大的医学数据中挖掘分析所蕴藏的有价值的信息资源,以辅助相关病例的辨诊治疗以及医学领域的研究发展。本文采用数据挖掘技术并在总结前人研究成果的基础上,对居民健康体检数据进行挖掘分析,构建2型糖尿病患病风险预测模型。首先,基于真实原生健康体检报告进行数据预处理,构建面向2型糖尿病患病风险预测的数据样本集。收集某医院健康体检中心2010-2015年中连续两年共2325位体检者脱敏后的4650份真实原生健康体检报告,评估数据情况并采用灵活配置方式对其进行数据集成、数据标准化、定性变量转换等一系列数据预处理工作以完成数据清洗优化,共得到2064例49维的可用样本,以此作为论文研究数据基础。其次,研究并提出一种基于随机森林与过滤式特征选择思想结合的特征选择方法,并筛选出2型糖尿病患病风险预测的最优特征子集。采用随机森林对数据预处理后的可用样本进行特征重要性评估,通过多次交叉验证取优的拟合分析发现共28个变量对相应结果产生可见影响,对其进行迭代增量划分,进一步分析28个特征子集在分类器的接收者操作特征曲线下面积(AUC)表现,最终筛选出包含9个特征变量的最优特征子集,保留其作为基于数据挖掘的2型糖尿病患病风险预测模型的输入变量。再次,研究并提出基于逻辑回归与极端梯度提升树(XGBoost)融合的2型糖尿病患病风险预测模型。分别基于逻辑回归、XGBoost构建预测模型,在此基础上研究并实现了逻辑回归与XGBoost的融合预测模型,对参数进行选择与调试,并使用独立测试集进行测试验证,结果表明本文所构建的三种模型均具有良好的效果,其中逻辑回归与XGBoost的融合模型表现最优,为本研究的最佳模型。最后,设计和实现2型糖尿病患病风险预测原型系统。以逻辑回归与XGBoost的融合预测模型为基础,结合实际应用场景进行需求分析、系统设计以实现原型系统,为进一步地推广应用形成支撑。
其他文献
<正> 随着考试制度的改革,标准化测试已成为会考的主旋律,而历史名词解释这一题型却很少出现,因而学生对这一题型逐渐陌生了。但我认为解释名词在历史教学中起着不可或缺的作
期刊
通过考察企业并购是否与并购方核心能力关联和并购中偏重的资本类型这两个维度 ,将并购中目标企业划分为四种类型 ,就四种类型中智力资本的运动状况进行了分析 ,并对四种类型
作为一名美术教师,如何上好美术课,提高美术课的教学质量和教学效果,让每个学生通过美术课的学习,在美术的基础知识与基本技能等方面有所收获、有所提高,是我经常思考的一个问题。
期刊
<正> 活塞式制冷压缩机的制冷量和有效功率与制冷工况、压缩机的汽缸尺寸、活塞行程、汽缸数目、压缩机转速和输汽系数有关。在拥有产品说明书时,可根据制冷工况在压缩机特性
微生物是自然界中一群构造简单的生物,虽然个体微小,但仍具有一定的形态和结构。与食品有关的微生物包括细菌、真菌、放线菌和病菌。国标中食品微生物的指标主要为菌落总数、大
现代公民的成长及公共社会的发育依赖公共精神的培育和生长。公共精神与公民的"公共"本性具有内在一致性,公共精神是公共生活及公共社会的基本属性与内在规定,公共精神是引领
<正>"语文主题学习"课题组联系方式联系人:黎老师手机:18910793688电话010—59766299转605地址:北京师范大学京师科技大厦A1110室邮政编码:100082邮箱:ztxx@joyschool.cn网址
随着全球经济金融的不断快速发展,人们的投资理财意识逐渐增强,愈来愈多的资金开始源源不断的涌向金融行业。对于我国股票市场,在最近5年的时间内全国股票成交量翻了四倍,足
瞬变电磁法是一种人工源时间域电磁勘探方法,近年来广泛应用于矿产和资源勘查、水文地质、工程地质勘查等领域。该方法具有工作效率高、勘探深度大、受地形影响小等优点。瞬变电磁法的三分量探测提高了采集数据量,可以更加直观地观测地质体。为了能够充分利用三分量数据,需要进行瞬变电磁三分量响应特征研究,建立瞬变电磁三分量解释理论及电导率深度成像方法的研究,有助于提高探测的分辨率和精度。对实际生产工作具有指导意义。
<正> 一、前言现代大型电厂在煤粉点火中需要消耗大量优质燃料。本文所介绍的工作说明点火所需的能量可以大大减少。在一座电厂中,旋涡稳定的电弧空气加热器被插入普通的煤粉