论文部分内容阅读
数据库技术的快速发展,使得信息技术渗透到包含医疗卫生在内的多个领域之中。现在,为了使医疗信息在区域范围中各医疗机构间得以共享,许多医疗信息中心建立了基于电子健康档案的区域卫生信息平台。随着时间的推移和建档人数的增加,区域卫生信息平台中的健康档案数据库中的数据量逐渐膨胀,数据库的规模逐渐扩大,复杂度也随之日益增加。但是,尽管积累了大量的健康档案数据,能将这些数据中的价值挖掘出来,并应用于日常的各种决策中的却非常的少。因此,从电子健康档案数据中挖掘出有价值的信息,具有重要的意义。再加上糖尿病是严重威胁人体身体健康的疾病。近年我国的糖尿病发病率日益升高,使得糖尿病的防治得到了众多医疗工作者的重视。电子健康档案的建立不仅能从管理上辅助糖尿病的防治,而且其中还隐含着一些与糖尿病相关的信息。因此,本论文选取数据挖掘技术,对电子健康档案数据进行分析与建模,得到一些与糖尿病相关的信息。并将这些模型应用与糖尿病决策支持系统的建立之中,以实现对电子健康档案的利用。本论文的主要内容包括以下三个部分:(1)针对糖尿病高风险人群的难以预测的问题,本文选取数据挖掘中分类方法对健康档案数据进行数据拟合,构建糖尿病患者的分类模型。并且从该分类模型中提取出一些对糖尿病患者进行分类的规则,以及分析了一些影响糖尿病病发的相关因素。(2)针对糖尿病同其他疾病之间可能存在的关系问题,选取了数据挖掘中的关联方法,对健康档案中的个人既往史的记录进行数据挖掘应用。从健康档案数据中提取部分关联规则,实现健康档案的价值。(3)结合数据挖掘和数据仓库技术,在区域卫生信息平台基础上,设计并构建电子健康档案数据仓库,最终实现健康档案的数据挖掘系统,实现各级决策者对健康档案数据的利用和分析,为决策制定提供信息支持。在本课题的研究中,将数据挖掘技术应用于现有电子健康档案数据的分析利用之中,并从中提取出一些模式。