基于数据挖掘技术的糖尿病并发症研究与预测

来源 :青岛科技大学 | 被引量 : 1次 | 上传用户:menes127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的飞速发展令信息技术在智慧医疗建设方面取得了长足进步。传统治病方式是依据医生自身专业知识及累积经验来治疗疾病,而使用数据挖掘技术得到医疗大数据的可用信息,可以更容易找到预防及治疗疾病的医学规律。当今社会生活压力不断增大,糖尿病的发病率每年都在上升,而糖尿病并发症在早期很难被发现并且确诊后很难被完全治愈,这对于患者本人及家庭而言都是一种相当大的压力,甚至会给社会带来恶性影响。因此,挖掘与研究糖尿病患者信息,辅助医生做出正确诊断,是一个有价值的研究方向。本课题采用人工智能机器学习方法开展科学研究,主要工作及成果如下:(1)数据预处理。本课题使用的数据集是直接从医院数据库中获取的原始数据集,数据质量较差。在预处理中,主要对数据进行特征选择、缺失及异常值处理、数据标准化处理等操作,完成后对新数据集进行全面的数据分析,从而更了解数据集的特点。(2)改进关联规则Apriori算法对糖尿病并发症进行关联分析。本课题通过分析传统Apriori算法本身存在的现实弊端,如需要很大的I/O负载以及产生大量冗余性候选项集等问题,来对其进行改进。首先将预处理后的数据集转化为布尔矩阵,对布尔矩阵进行行列压缩以减少数据的规模,用索引表存放生成的候选项集,并且在对频繁项集查找时引入Tried树查找的方法。通过对比实验发现,与传统Apriori算法相比,改进后的算法在时间和空间效率上有很大的提高。最后利用改进算法挖掘预处理后糖尿病数据集的关联关系,从而更快更高效的找到糖尿病并发症间的强关联规则。(3)优化BP神经网络构建糖尿病并发症预测模型。通过数据预处理后分析糖尿病数据集的特点,选取BP神经网络构建糖尿病并发症预测模型。BP神经网络存在易陷入局部极小值、在学习过程中收敛速度慢、网络结构不易确定等自身局限性,而遗传算法本身具有全局搜索能力,该特点用于优化BP神经网络的初始结构。遗传算法本身容易陷入局部最优解,影响自身的寻优能力,故对该算法进行改进。主要改进遗传算法的选择方法及遗传算法的交叉、变异概率公式,最后构建糖尿病并发症预测模型,通过仿真对比实验证明,本课题改进算法后所构建的预测模型具有更高的预测精度。
其他文献
科技产业园是当前社会热点,它既是科技发展的重要载体,承担科技发展的重要任务,又是一种新的经济形态,对促进区域经济发展发挥着重要作用,同时还是一种社会经济主体,面临强烈的市场竞争和生存发展压力。在现阶段国家大力倡导并推进科技发展的社会环境下,深入提升科技产业园发展能力,对于促进我国科技和区域经济发展具有重要的现实意义。本文首先介绍了论文选题背景和研究意义,评述了国内外研究现状,指出了研究内容与方法,
学位
工业物联网的关键之一在于数据基础设施的建设,而作为物联网架构中感知层载体的传感器设备,则是数据采集的神经末梢。时序数据作为一种重要的科学服务资源在传感器采集的数据类型中普通存在,具有数据量大,数据维度高,依赖关系复杂等特点。传感器预测与误差补偿技术作为时间序列分析中的重点研究领域,旨在挖掘数据序列内在的时空规则,分析不同来源、异构属性间的依赖规律,进而构建数据模型,对目标数据进行预测或修正。其中,
学位
随互联网金融迅速发激励代,国家不断强化监控和规范办法,行业内竞争愈演愈烈,为巩固市场份额,电话营销成为众多金融企业重要营销手段,目前电销员工大部分是劳务派遣人员,该群体的工作状态关系着公司销售业务增长。但是电销劳务派遣员工面对着工作强度相近,薪酬有别的待遇以及公司认同感低的工作处境,导致员工工作萎靡,销售业绩难以突破。因此如何激励电销团队劳务派遣员工,是X公司电销业务健康发展的首要因素。本文以X公
学位
2型糖尿病属于糖尿病的一种最主要分类,在所有糖尿病患病人群中,2型糖尿病患者能占到9成以上的比例。截止到2021年,我国已经有将近1亿4千万糖尿病患者,是全球糖尿病患者数量最多的国家,其中基本上都是2型糖尿病患者,尤其是老年患者居多,且患病人群的年龄也越来越年轻。2型糖尿病还会引发多种并发症,其并发症导致的死亡率和致残率非常高,2021年全球大约有670万人死于糖尿病及其并发症,相当于每5秒就有一
学位
2019年以来,在面临疫情冲击、遭遇持续的高压调控政策以及中国城镇化建设放缓的多方面因素的影响下,中国房地产企业通过融资进行高杠杆、高周转追求规模和效率的经营模式已经不能适应市场,市场进入了竞争激烈的存量市场时代。如何在新市场环境下,实现更精益的经营管理体系,更快速的业务转型,更有效的商业模式创新等要求摆在行业面前。而通过数字化手段全面推进数字技术与业务场景的深度融合,实现精细运营、降本增效,提高
学位
目标检测与目标跟踪技术能准确、及时地获取实体时空位置属性信息,因此也被誉为计算机领域最具活力和发展潜力的技术之一。近年来,随着深度学习的迅速发展,目标检测、跟踪等技术也向着更加精准、迅速的方向前进。作为自动驾驶、虚拟现实、行为理解等诸多领域的核心技术之一,基于深度学习的目标检测和跟踪技术受到了海内外研究者的普遍重视。本文也将进行基于深度学习的目标检测以及目标跟踪等关键技术的研究。总体而言,检测是跟
学位
在经济飞速发展的21世纪,越来越多的企业希望通过资本市场来获取大量的资金来谋求企业自身的长远发展,以期望可以赢得市场青睐成为行业领先的企业。为了实现这一目的,IPO就成了众多企业登录资本市场的选择,但是由于IPO的门槛较高、审批时间相对较长,借壳上市这一登录资本市场的模式也成为了众多企业的选择。借壳和IPO是可以同时出现在我国的资本市场中,这一模式有利于吸收资本,扩大企业规模,此外,还能推动我国企
学位
山东省是一个农业大省,准确监测干旱的发生、旱情等级以及旱情影响范围等,对山东省的社会经济发展具有重要意义。干旱发生的原因较为复杂,本文综合考虑降水、植被、地表温度以及土壤湿度等数据,同时综合考虑大气、植被以及土壤之间的水分与能量交换的问题,添加MOD16A2蒸散数据计算的作物缺水指数(CWSI),考虑各致旱因子间的线性与非线性关系。以山东省时间尺度为2000—2019年1—12月份的多源遥感数据计
学位
当前,全球正在经历一场深刻的技术变革,数字化体现在产业、社会和国家发展的各个领域。本人所在的O公司有一定数字化转型的基础,但仍存在一些转型不完善、协同配合度不高的现象,日常工作中经常出现数据口径不统一、数据体系维护难、数据质量不可靠等问题。基于对日常工作、行业经验的思考和积累,本人提出O公司互联网业务部的数字化运营优化策略研究这一课题。本研究以O公司互联网业务数字化运营为案例分析,通过查阅相关的文
学位
人脑是一个极其复杂的系统,揭示其运作和功能模式仍然是神经科学领域专家的重要挑战。脑电信号是大脑在特定部位产生的神经性生理电活动,也是了解大脑机能的一种重要途径。如今随着机器学习,深度学习等技术的发展,对于脑电信号的研究提供了新的角度和研究方式,进而对脑电信号的研究地更加深刻。在现代医学诊断中,通过脑电信号对多种脑科疾病和精神系统疾病(例如脑外伤、抑郁症、癫痫、焦虑症等)的诊断都是非常有效的一种方式
学位