论文部分内容阅读
随着我国信息技术的发展,特别是进入21世纪以来,信息系统已经广泛应用于各类医疗卫生机构。但是由于缺乏统一的组织与设计,各系统之间缺少互通互联,数据难以实现共享,特别是居民电子健康档案部分,存在严重的“信息孤岛”、“烟囱信息”现象。为改变这一现状,2009年5月卫生部下发了《基于健康档案的区域卫生信息平台建设指南(试行)》,目的是为了建立区域内统一的卫生信息服务系统,将分散的卫生数据进行有效的集成,从而满足不同层次用户对卫生数据的需求。本文从区域卫生信息平台建设对健康档案数据仓库的需求出发,系统研究了数据仓库的相关技术、体系结构以及实现方法。分别介绍了联机分析处理(简称OLAP)多维数据分析方法,以及数据挖掘技术的概念、原理。研究了数据挖掘的过程与实现步骤。分析研究了健康档案数据仓库的多维数据模型设计,利用SQL Server 2008数据库的OLAP功能和关联规则实现了对健康档案数据的挖掘,获得了预期的结果。主要完成工作包括:1.重点研究了健康档案数据仓库的设计与构建。梳理了健康档案数据的业务流程与数据特点,划分了5个业务主题域和31个子域,提出了健康档案数据仓库的概念模型和逻辑模型的设计方案,以及健康档案数据立方体的设计方案。2.利用SQL Server 2008数据库系统,创建了用于存储健康档案数据的事实表、维表,设计实现了健康档案数据立方体,完成了健康档案数据仓库的物理实现过程。3.利用OLAP技术,对某市健康档案数据中居民的死亡原因进行了多维数据挖掘,得出了慢性非传染性疾病是导致该市居民死亡的主要原因的结论。4.阐述和分析了关联规则挖掘的Apriori算法,并将其应用于新生儿出生缺陷的病因分析,挖掘出5种满足特定支持度和可信度的规则,并与临床经验相符合。