基于数据挖掘的疾病预测组合模型研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:ziones
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗行业信息化发展,越来越多的医疗信息数据产生,医疗行业与大数据结合成为必然的趋势,医疗领域越来越多的产品将要应用到大数据技术,医生决策,病患诊断离不开大数据技术。生活水平的提高使得越来越多的人患有健康病,高血压和高血脂作为常见的慢性病易于引发脑卒中、心力衰竭、肾脏衰竭、心脑血管疾病等,而这些疾病的发生与多种因素有关,从各个因素能够预测疾病的发病风险。本文从预防医学的角度出发,以搭建组合疾病预测模型为目的,探究海量体检数据疾病风险发生的概率,并给出影响高血压这一疾病的指标危险程度。本文的主要工作如下:(1)提出了基于Choquet积分的数据挖掘模型的预测算法,算法不仅组合了不同的模型,并能够对不同组合进行筛选流程。预测模型非常多,每个模型的刻画数据的角度不同,考虑到模型对预测结果可能产生的影响,以及模型之间的交互作用也可能对预测结果产生影响。本文利用模糊积分衡量不同模型的模糊测度以及模型之间的交互作用,经实验分析,大大提高了预测的准确率。本文选择了五种模型,分别对五种数据挖掘领域的模型进行预测并评估,并通过模糊积分确定单模型权重和交互权重确定模型组合预测值,并进行比较,实验发现组合模型相比单模型具有一定的优势。(2)提出了基于Choquet积分的模型组合的特征筛选方法。特征筛选的方法有很多,本文从模型的角度对数据特征进行筛选,不同模型的衡量角度会有差异,本文构建了基于组合模型特征筛选的算法,实现从模型角度以及模型交互角度对特征重要性的贡献程度。同时考虑到特征特征与标签之间的交互作用,对特征进行了相关分析。(3)本文利用实际场景中的体检数据对某一类疾病高血压做预测,并通过对数据集成、数据清洗、数据填补及降维构建了基于模型融合的预测体系,制定了基于大数据的疾病风险预测模型。通过预测模型所得结果可以为从医人员提供一定的决策帮助。在此,利用logistic回归分析影响疾病指标高低的重要因素,对其进行相关解读。
其他文献
为了扭转颓废奢靡的社会风气,太平天国在统治江南期间曾厉行查禁烟、酒、赌、娼妓等恶习陋俗,产生了一定的积极影响,但由于主客观方面的原因,相关法令逐渐形同虚设,并没有能
介绍了汽车发动机铝合金缸盖传统铸造工艺及新工艺,概述了几种常见铸造工艺的优缺点及应用现状和前景,系统地分析了铝合金缸盖铸造中气孔、渗漏和孔洞夹杂物等常见缺陷的形成
老北京叫卖是人类非物质文化遗产上的宝贵智慧和精神血脉,是穿透历史的声音。今天,当曾经回荡在老北京城的叫卖声再一次鲜活呈现出来的时候,人们在寻找一种历史的积淀,回味这
本文对美国近年关于控烟立法效果评价进行综述。美国控烟立法主战场在州级立法。控烟立法在大多数州取得明显效果,使成人、青少年吸烟率、SHS暴露率和死亡率降低;不吸烟、戒
针对TC11/TC17线性摩擦焊接头及母材进行了高周疲劳性能测试。结果表明,接头的高周疲劳强度与TC11母材相当,断裂发生在TC11母材一侧。通过对断口形貌进行分析,发现疲劳断口分
用国产非调质钢C70S6代替德国非调质钢C70S6试制了连杆,并对连杆的性能进行了检测。结果发现:国产C70S6连杆的化学成分、显微组织、力学性能、疲劳性能和台架耐久性能等满足
介绍了6YX-800型干果高压喷淋清洗机的主要结构、工作原理、技术性能、机具改进设计及其推广使用情况。
<正>轮胎行业的人大代表软控股份有限公司董事长袁仲雪、风神轮胎股份有限公司董事长王锋和三角集团董事长丁玉华在2015年的人大会上或相关采访中对轮胎行业的发展提出了自己