论文部分内容阅读
近年来,数字化医疗与医疗信息化成为当代医疗卫生健康领域的重要发展方向,医学领域得以快速发展的同时,医疗卫生服务体系也面临很多严峻的问题。因此传统医疗数据的表示和迁移,以及医院不同科室之间、不同医院之间、医院和其他的医疗机构之间的信息共享成为该研究领域的一个重点课题。本文研究的面向数据迁移的医疗数据规范化关键技术是实现医疗数据迁移和共享的一个重要研究方向。所谓数据迁移就是将数据库中的数据(包括结构定义)正确转移并使之能够正常运行,其目标就是必须要保证数据安全、无损、完整的从旧数据库系统迁移到新的数据库系统上。 本文着重研究数据迁移过程中医疗数据规范化的问题,如果医疗数据没有统一的标准就很难实现不同的系统的数据迁移,更不用说实现不同医疗机构之间的数据共享和区域医疗乃至全国电子健康档案了,并且电子病历系统也就很难走向实际应用。因此医疗数据规范化是一个很有挑战性的问题,因为医疗数据具有独特的特点: 第一,医疗数据源中的各个数据对象具有结构复杂性,数据对象往往具有多层嵌套结构,并且对象的成分具有可缺失、多次重复、有序出现或无序出现等特有属性,因此其存储方式多种多样,给实现数据迁移带来了很大的困难。 第二,医疗数据规范化规则具有复杂性,医疗数据常用非标准的描述性语言或医学缩略语对数据对象进行描述,许多需要规范化的对象甚至没有恰当医学词汇可以描述,而它又必须要在某些数据对象内容中出现,因此在数据迁移和数据共享过程中很容易导致歧义的产生。 第三,医疗数据的映射规则具有复杂性,一方面医疗数据的复杂性决定了其映射规则具有更高的复杂性,另一方面医务工作者往往需要对己有数据对象实施一定操作后才能将它们组装到数据库中,从而加剧了其映射规则的复杂性。 目前国内外都注重区域医疗和国家级电子健康档案的实施,但是在数据规范化方面上述问题都没有得到完善的解决。本文针对医疗数据规范化研究的不足,提出了面向数据迁移和共享的较为通用的数据规范化方案,主要研究内容从两个方面入手,一个方面是对现有医疗数据进行带语义信息的规范化表示,另一个方面是对传统的医疗数据进行带语义信息的数据迁移,具体内容如下:从各种医院信息系统的医疗数据源中抽取电子病历数据的内容作为数据对象,并将这些数据对象组装集成到符合国际标准HL7的电子病历系统中,目的在于为医院搭建从以财务为核心的医院信息系统到以患者为中心的电子病历系统乃至全国通用的电子健康档案系统,以方便以后的数据迁移;医疗数据规范化的表示、和存储;数据迁移的方案以及通用平台构建等几个方面。这些问题的研究在较大程度上解决了现有医疗数据迁移和共享存在的主要问题。本文的主要贡献包括: 1、提出了一种利用现有不同的医学术语表构建医学词汇本体库的方法。根据当前医疗现状和医疗工作者的实际需求,提出了改进的七步法构建本体库的基本思想,利用国际医学术语词汇表SNOMED、ICD10和国家药品标准库为数据源构建了消化内科的医学词汇本体库,并将其进行了实践应用,从医疗数据的语义根源上实现了数据的规范化,保留了对未来医疗数据的集成与共享过程的语义信息,方便将来系统的数据迁移,避免了传统的医疗数据的语义歧义性。 2、提出了一种带语义关系的新的医疗数据表示方法。医疗数据规范化的关键问题之一就是要实现医疗数据的规范化表示,它是医疗数据能够实现计算机处理和数据迁移以及数据共享的前提。本文在医疗词汇本体库的基础上,通过HL7的规范化文档结构CDA来实现医疗数据的规范化表示,建立医疗数据之间的语义关系,并最终通过XML模式的形式在数据语义表示层次上实现医疗数据的共享,为以后便捷的数据存储和检索提供基础。 3、提出了利于数据迁移和共享的混合存储模型机制。根据HL7 CDA标准和医疗数据的特点,提出了利用混合数据库实现电子医疗数据的关系数据库表和Native XML数据库的XML文档的混合存储模型,该模型集合关系数据库和XML文档的数据存取的优势,对医疗数据进行优化存储,既可节省数据存储空间又可实现医疗数据的实时查询与检索,同时也方便了区域医疗的数据传递与共享。 4、提出了大文本到EAV数据模式的映射机制。当前我国的医疗数据应用多是基于统计分析的综合利用,而与病历相关的数据却使用大文本的形式存储,据此本文改进了现有的EAV模型,利用扩展的EAV模型和索引相结合的方法,提出了大文本到EAV数据模式的映射机制及其相关算法,以方便文本数据的迁移和医疗数据的后期应用。 5、将以上研究成果集成起来,本文提出了一种通用传统医疗数据迁移的平台框架。该框架根据目前我国医院信息系统的数据迁移现状和需求情况,在医学词汇本体库的基础上将医疗数据实现规范化的表示和存储,利用EAV模型和索引相结合的方法,构建通用传统医疗数据迁移的平台,并利用医疗词汇本体库的语义关系保证数据迁移的完整性,从而实现各个医疗机构的医疗数据迁移以及不同医疗机构之间电子病历的交换和共享问题。