论文部分内容阅读
近年来,随着电子信息技术的迅速发展,我国的医院信息系统(Hospital Information System,简称HIS)已经发展成熟,医院信息系统和数字医疗设备的广泛应用,导致医院数据库的信息容量不断膨胀。然而当面对越来越多迅速膨胀的超级数据库时,却出现了“数据丰富,知识贫乏”的现象。如果人们未能深入理解数据库中储存的数据,可能浪费了有价值的信息资源。如何充分利用这些宝贵的信息资源来为临床科研、疾病的诊断和治疗提供科学的指导、为医院领导决策提供科学的依据,已成为当前医院信息化建设亟待解决的问题。针对这种现状,本课题在分析现行医院信息系统的缺陷后,提出了建立基于医院信息系统的数据仓库,在此基础上,对数据仓库中的医疗数据进行相关的数据挖掘,将数据挖掘理论与医学信息相结合,发现数据变化的规律,得出有价值的结论,以望给科研人员的工作带来帮助。本课题主要进行了以下研究:1.学习和研究数据挖掘相关理论,以及SQL Server 2008在数据仓库与数据挖掘中的应用,结合医院信息系统的现状,以及医学数据的特点,探讨了数据挖掘技术在医院信息系统的应用。2.以HIS历史数据作为数据源,建立SQL Server数据仓库,作为后续工作的数据基础。SQL Server 2008是在SQL Server 2005的基础之上,进一步对各项服务进行改进,是一个完整的数据管理与商业智能平台,在性能和可扩展性方面排在世界领先的地位。3.运用SQL Server 2008的集成环境Business Intelligence Development Studio创建和使用基于数据仓库的数据挖掘模型。该环境包括数据挖掘算法和工具,使用这些算法和工具更易于生成用于各种项目的综合解决方案。4.研究了关联规则算法,提出了Apriori算法的一个改进算法,并将关联规则应用到挖掘糖尿病及其并发症之间的关系和乳腺癌复发因素的研究中。实践证明,数据挖掘在医院信息系统中的应用具有广阔的发展前景。