健康档案数据仓库构建及数据挖掘技术研究

被引量 : 0次 | 上传用户:ycw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国信息技术的发展,特别是进入21世纪以来,信息系统已经广泛应用于各类医疗卫生机构。但是由于缺乏统一的组织与设计,各系统之间缺少互通互联,数据难以实现共享,特别是居民电子健康档案部分,存在严重的“信息孤岛”、“烟囱信息”现象。为改变这一现状,2009年5月卫生部下发了《基于健康档案的区域卫生信息平台建设指南(试行)》,目的是为了建立区域内统一的卫生信息服务系统,将分散的卫生数据进行有效的集成,从而满足不同层次用户对卫生数据的需求。本文从区域卫生信息平台建设对健康档案数据仓库的需求出发,系统研究了数据仓库的相关技术、体系结构以及实现方法。分别介绍了联机分析处理(简称OLAP)多维数据分析方法,以及数据挖掘技术的概念、原理。研究了数据挖掘的过程与实现步骤。分析研究了健康档案数据仓库的多维数据模型设计,利用SQL Server 2008数据库的OLAP功能和关联规则实现了对健康档案数据的挖掘,获得了预期的结果。主要完成工作包括:1.重点研究了健康档案数据仓库的设计与构建。梳理了健康档案数据的业务流程与数据特点,划分了5个业务主题域和31个子域,提出了健康档案数据仓库的概念模型和逻辑模型的设计方案,以及健康档案数据立方体的设计方案。2.利用SQL Server 2008数据库系统,创建了用于存储健康档案数据的事实表、维表,设计实现了健康档案数据立方体,完成了健康档案数据仓库的物理实现过程。3.利用OLAP技术,对某市健康档案数据中居民的死亡原因进行了多维数据挖掘,得出了慢性非传染性疾病是导致该市居民死亡的主要原因的结论。4.阐述和分析了关联规则挖掘的Apriori算法,并将其应用于新生儿出生缺陷的病因分析,挖掘出5种满足特定支持度和可信度的规则,并与临床经验相符合。
其他文献
设棱台的两底面积分别为S上,S下,棱台中截面面积为S0,则有2S0=S上+S下.此公式的结构使我们易于联想到解析几何的中点坐标公式.下面以三棱台为例探索问题的一般形式.为方便起见,这里约定棱台上、
流域生态环境质量评价一直是我国流域生态保护工程的一项基础工作,是流域土地结构合理配置和综合管理的重要依据,关系着实施流域生态环境综合治理工程部署的合理与否。因此,
网络课程设计应在满足学生需求的基础上,有针对性地进行设计。"高职高专《实用英语》网络课程建设"课题组以问卷、访谈的方法调查学生的需求,通过对相关指标数据的统计与分析
FIDIC是国际咨询工程师联合会的简称。FIDIC合同是国际土木工程在项目招标、投标、签订承包合同、以及费用支付、工程变更、价格调整和索赔等方面具有国际权威的通用标准,因
艺恩旅游咨询统计数据显示:2010年中国旅游电子商务产业规模达到390亿元,相比2009年的275亿元增长42%,预计未来2年旅游电子商务市场的年增长率保持在30%以上,到2012年市场规模
随着我国市场经济的建立与发展,一些企业,如建筑业、制造业也陆续应用了全寿命周期管理的方法,并取得了一定的效果。近几年在电力行业已有所应用,为全面国网公司以"三通一标"为
作者对路由器的逻辑体系结构进行了深入分析,指出构成路由器的三大模块是:网络接口模块、搜索引擎模块和协议配置与控制模块;重点分析了路由器体系结构发展过程,对目前的六类
在企业中,人事管理的信息量和信息类型越来越多,工程流程越来越清晰,社会分工越来越细。原来传统的人工处理方式越来越不能适应人事管理的需要,满足不了新形势下企业人事管理