面向数据迁移的医疗数据规范化关键技术研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:haoxiang123123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数字化医疗与医疗信息化成为当代医疗卫生健康领域的重要发展方向,医学领域得以快速发展的同时,医疗卫生服务体系也面临很多严峻的问题。因此传统医疗数据的表示和迁移,以及医院不同科室之间、不同医院之间、医院和其他的医疗机构之间的信息共享成为该研究领域的一个重点课题。本文研究的面向数据迁移的医疗数据规范化关键技术是实现医疗数据迁移和共享的一个重要研究方向。所谓数据迁移就是将数据库中的数据(包括结构定义)正确转移并使之能够正常运行,其目标就是必须要保证数据安全、无损、完整的从旧数据库系统迁移到新的数据库系统上。  本文着重研究数据迁移过程中医疗数据规范化的问题,如果医疗数据没有统一的标准就很难实现不同的系统的数据迁移,更不用说实现不同医疗机构之间的数据共享和区域医疗乃至全国电子健康档案了,并且电子病历系统也就很难走向实际应用。因此医疗数据规范化是一个很有挑战性的问题,因为医疗数据具有独特的特点:  第一,医疗数据源中的各个数据对象具有结构复杂性,数据对象往往具有多层嵌套结构,并且对象的成分具有可缺失、多次重复、有序出现或无序出现等特有属性,因此其存储方式多种多样,给实现数据迁移带来了很大的困难。  第二,医疗数据规范化规则具有复杂性,医疗数据常用非标准的描述性语言或医学缩略语对数据对象进行描述,许多需要规范化的对象甚至没有恰当医学词汇可以描述,而它又必须要在某些数据对象内容中出现,因此在数据迁移和数据共享过程中很容易导致歧义的产生。  第三,医疗数据的映射规则具有复杂性,一方面医疗数据的复杂性决定了其映射规则具有更高的复杂性,另一方面医务工作者往往需要对己有数据对象实施一定操作后才能将它们组装到数据库中,从而加剧了其映射规则的复杂性。  目前国内外都注重区域医疗和国家级电子健康档案的实施,但是在数据规范化方面上述问题都没有得到完善的解决。本文针对医疗数据规范化研究的不足,提出了面向数据迁移和共享的较为通用的数据规范化方案,主要研究内容从两个方面入手,一个方面是对现有医疗数据进行带语义信息的规范化表示,另一个方面是对传统的医疗数据进行带语义信息的数据迁移,具体内容如下:从各种医院信息系统的医疗数据源中抽取电子病历数据的内容作为数据对象,并将这些数据对象组装集成到符合国际标准HL7的电子病历系统中,目的在于为医院搭建从以财务为核心的医院信息系统到以患者为中心的电子病历系统乃至全国通用的电子健康档案系统,以方便以后的数据迁移;医疗数据规范化的表示、和存储;数据迁移的方案以及通用平台构建等几个方面。这些问题的研究在较大程度上解决了现有医疗数据迁移和共享存在的主要问题。本文的主要贡献包括:  1、提出了一种利用现有不同的医学术语表构建医学词汇本体库的方法。根据当前医疗现状和医疗工作者的实际需求,提出了改进的七步法构建本体库的基本思想,利用国际医学术语词汇表SNOMED、ICD10和国家药品标准库为数据源构建了消化内科的医学词汇本体库,并将其进行了实践应用,从医疗数据的语义根源上实现了数据的规范化,保留了对未来医疗数据的集成与共享过程的语义信息,方便将来系统的数据迁移,避免了传统的医疗数据的语义歧义性。  2、提出了一种带语义关系的新的医疗数据表示方法。医疗数据规范化的关键问题之一就是要实现医疗数据的规范化表示,它是医疗数据能够实现计算机处理和数据迁移以及数据共享的前提。本文在医疗词汇本体库的基础上,通过HL7的规范化文档结构CDA来实现医疗数据的规范化表示,建立医疗数据之间的语义关系,并最终通过XML模式的形式在数据语义表示层次上实现医疗数据的共享,为以后便捷的数据存储和检索提供基础。  3、提出了利于数据迁移和共享的混合存储模型机制。根据HL7 CDA标准和医疗数据的特点,提出了利用混合数据库实现电子医疗数据的关系数据库表和Native XML数据库的XML文档的混合存储模型,该模型集合关系数据库和XML文档的数据存取的优势,对医疗数据进行优化存储,既可节省数据存储空间又可实现医疗数据的实时查询与检索,同时也方便了区域医疗的数据传递与共享。  4、提出了大文本到EAV数据模式的映射机制。当前我国的医疗数据应用多是基于统计分析的综合利用,而与病历相关的数据却使用大文本的形式存储,据此本文改进了现有的EAV模型,利用扩展的EAV模型和索引相结合的方法,提出了大文本到EAV数据模式的映射机制及其相关算法,以方便文本数据的迁移和医疗数据的后期应用。  5、将以上研究成果集成起来,本文提出了一种通用传统医疗数据迁移的平台框架。该框架根据目前我国医院信息系统的数据迁移现状和需求情况,在医学词汇本体库的基础上将医疗数据实现规范化的表示和存储,利用EAV模型和索引相结合的方法,构建通用传统医疗数据迁移的平台,并利用医疗词汇本体库的语义关系保证数据迁移的完整性,从而实现各个医疗机构的医疗数据迁移以及不同医疗机构之间电子病历的交换和共享问题。
其他文献
随着互联网技术的发展,Web上出现了大规模的用户和数据。对Web2.0时代海量信息进行有效的组织和分析,可以为用户提供更好的服务,具有非常重要的意义。树状标签系统就是对这些信
网络拓扑管理作为IP网络管理的基本功能,主要实现网络拓扑自动发现、更新和配置信息管理。随着互联网的飞速发展,网络规模也在迅速扩大,基于IPv4协议的互联网逐渐显示出地址
目前,机器人的应用领域已经扩展到了几乎所有的行业,并发挥着越来越大的效用,创造着巨大的价值以及有了越来越大的影响力。移动机器人是机器人学科的一个重要分支,而对移动机器人
现实生活中,经常会遇到以下情况。当走在大街上突然听到一首引人注意的歌曲,它很可能就是非常喜欢的一首音乐,但是刹那间无法想起它的名称以及演唱者。这样就不可能利用音乐名称
无线传感器网络,因容易布置、造价低廉、功耗微小等优点,在军事和许多其它领域具有广泛的应用潜景,也因此成为学术界研究的热点。由于无线传感网络无集中的控制结点,广播通讯会消
图像中的文字包含着丰富的语义信息,对于理解图像的内容具有重要意义。有了文字信息的帮助,可以方便地进行图片的分类、索引与检索,并进而设计各类应用。因此,图像文字区域检测已
随着信息技术的大力发展,人们所拥有的信息量也在不断的增加。对于大量的信息数据来说,如何获取隐含在数据中有价值的内容,是人们所关心的问题。可视化技术就是将科学计算中产生
本论文主要研究了期权定价模型中的反问题,即波动率校准问题的数值方法。这是一类具有广泛应用价值的问题。此类反问题是根据不同执行价格和不同到期日的期权市场观测价格来确
海洋对全球气候的变化起着主要的影响,雷达高度计是开展大地测量学,海洋动力学研究的重要工具。针对雷达高度计进行的定标工作也成为雷达高度计研究的十分重要的组成部分。 
本文是以“教育科研基础设施IPv6技术升级和应用示范——重点学科信息资源系统IPv6升级”项目为研究背景,该项目是中国下一代互联网示范工程(CNGI)项目中的子项目,其内容为基于