论文部分内容阅读
过去的几十年间,我国的医院信息系统伴随着电子信息技术的不断发展已经较为成熟,医院信息系统的广泛应用和医疗设备的数字化,致使医院数据存储量与日俱增,一些大型和超大型的数据库被用来存储海量的医院数据。而事实上,对于大部分医院来说,数据库中的数据处理仅仅局限于日常的事务处理,即增删改查,缺乏对数据的集成与分析处理,面对急剧增大的数据库,出现了“数据丰富,知识贫乏”的现象。居民健康档案是医院信息系统发展的一个分支,主要记录了社区居民周期性体检的档案健康资料,其作用体现在以下三个方面:方便档案所属人及时掌握个人的健康状况、提供医务人员相应患者详细的历史病历数据和提供有用的信息辅助卫生行政部门决策疾病预防控制方案以及制定卫生政策法规。由于医学数据的特征决定了其数据挖掘的复杂性,人们未能深入挖掘数据库中存储的健康档案数据,在一定程度上有价值的信息资源被浪费。如何最大化的利用这些宝贵的居民健康档案资料来为居民提供及时的个人健康状况,为临床科研、疾病的诊断和治疗提供科学的指导,为卫生行政部门决策提供科学的依据,已经成为当前居民健康档案系统建设亟待解决的问题。针对此现状,本论文在分析我国居民健康档案系统的现状后,提出了建立基于居民健康档案系统的数据仓库,并运用数据挖掘聚类方法分析居民健康档案,将数据挖掘理论与医学信息有机结合在一起,发现其数据的变化规律,归纳出有价值的总结,希望给接下来的科研人员带来帮助。本课题主要进行的研究如下:1.研究数据挖掘技术的相关理论和方法,重点分析了聚类K-means算法,罗列出了其优缺点并作了详细的对比,提出了改进型K-means聚类算法,通过仿真实验表明了改进后的算法在时间复杂度和空间复杂度上均有显著提高;2.在《国家基本公共卫生服务规范》的基础上,研究了我国居民健康档案的现状,结合本课题的研究,提取出糖尿病相关部分数据,进行了聚类K-means算法的实践应用:3.通过构建居民健康档案模型系统可以将研究的内容具体化和可视化,便于理解居民健康档案的数据特征及在数据挖掘技术方面的应用。