数据驱动的慢性疾病风险因素关联分析及再入院预测研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:abczvw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,现如今,各行各业都离不开对数据的处理、分析,和发现新的学习模式。数据挖掘技术中包含的时间序列分析、关联分析,以及机器学习中分类、预测、聚类分析等方法也已经广泛应用到了现实生活中。慢性非传染性疾病对全球人类健康造成了巨大的影响以及严重的疾病负担,在中国,慢病已成为城乡居民的主导疾病。近年来,对慢病风险因素的研究也逐渐增多。本文针对高血压、糖尿病等27种慢病,有效利用了数据挖掘技术中的时间序列分析、聚类分析和关联规则挖掘技术、以及机器学习方法对慢病患者的住院医疗数据进行分析处理,为防治慢病提供科学依据。本文重点研究了大气污染对慢病患者的健康影响、慢病并发症的关联挖掘以及慢病住院患者的再入院风险预测,主要研究内容分为以下三个部分:(1)空气污染物与慢病的健康效应分析。利用广义相加模型(GAM),研究空气污染物对慢病患者的急性健康效应,并将年龄、性别以及季节等分层实验作为敏感性分析,确保了实验结果的稳定性。(2)基于聚类分析的慢病及其并发症的关联规则挖掘。本文结合聚类分析和关联规则挖掘技术进行了慢病并发症挖掘。首先利用三种聚类方法(k-mean++、平均连接法和离差平方和法)对27种慢病进行聚类处理,并在每个聚类簇中利用FP-growth算法获取慢病间并发症关系,建立了疾病网络;然后针对三种重点慢病在全疾病组间寻找共病组合。(3)基于机器学习的慢病住院患者再入院风险预测。本文基于逻辑回归以及随机森林、梯度提升树、light GBM三种集成学习模型建立了再入院风险预测基本模型。然后在基本模型进行了改进,提出了一种基于压缩存储的混合模型,结合树模型与逻辑回归模型,进一步提高了预测性能。
其他文献
期刊
为了降低宫颈癌根治术后尿潴留、尿瘘及泌尿道感染并发症的发生率,对39例早期宫颈癌病例,在实施根治术的同时作输尿管悬吊,部分阴道重建和膀胱造瘘术。结果表明,上述方法能显著降低
分析目前阻碍纯电动汽车发展存在的主要问题,研究纯电动汽车蓄电池的制造标准,探讨蓄电池置换站的运营管理模式,并建议在全国范围内建立蓄电池置换站,以进一步推动纯电动汽车
目的 探讨四肢骨折术后护理对压疮发病率的影响。方法 选取本院2013年3月-2015年1月收治的180例四肢骨折患者作为研究对象,按照随机数字表法分成观察组和对照组,各90例。对照
开展农村电网无功优化建设工作,对于加快实施新农村电气化工程,提高农网无功综合管理水平,提升农网经济运行水平和电压质量,为社会主义新农村建设提供优质、经济、可靠的电力供应
全球化时代中国对外政策所面临的挑战,就是中国如何消除邻国对中国崛起的疑虑和恐惧,确认一个美国占主导地位的国际体系,保证北京的力量发展与它的基本经济和安全利益同步,即中国
近年来,新生儿医院感染率有上升趋势,已引起国内外的关注.为了解新生儿医院感染的病因学,我们对2001年1月~2003年12月本院出生并住院的1 390例新生儿进行了调查,现报告如下.
安徽省首套太阳能站用电系统经过在巢湖市110kV柘皋变电所的一年正式运行,已节省电能约3万kwh,降低用电负荷5kW,减少CO2排放量约300t。系统充分发挥了节能降耗作用,同时也成为新
涩尕猫是兰州人,真名叫周思鸣,1990年出生在一个公务员家庭,自幼接受声乐及钢琴训练,掌握了发音和控制呼吸气息的技巧。她说自己是“听觉动物”,喜欢声音的魔力,从小学开始,她就一直
本刊讯 2010年3月12日,“欧盟一中国节能变压器促进项目启动会暨电力变压器节能标准宣贯会”在北京召开。国家发展改革委资环司、国家标准化委员会、国家节能中心、欧盟代表处