论文部分内容阅读
根据研究机构Gartner给出的定义,“大数据”是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别看,“大数据”是无法使用传统流程或工具处理、分析的信息,是那些超过正常处理范围和大小,迫使用户采用非传统处理方式的数据集。医学影像数据正是这样一类超过正常处理范围和大小,迫使用户采用非传统处理方式的数据集。
非结构化数据正在激增
非结构化数据正在激增!非结构化数据无法用二维表结构来逻辑表达,因此不适合在目前依然是主流的关系型数据库中管理,它们大多以文件的形式保存,我们每天访问的网页、有感而织的“围脖”、在社交网站上分享的照片和在视频网站欣赏的电影都是一种非结构化数据。医疗影像数据也是一种非结构化的数据。
每天都有成千上万的数据在产生。人类的思维活动会产生数据,比如写微博、计算机辅助绘制图纸、创作音乐;大自然也会产生数据,比如通过传感器采集的温度、湿度、风速。但是只有经过分析处理的数据才称的上是信息,才具有价值,数据库管理系统的意义就在于能够更好的组织、存储和管理数据,为此科学家们还发明了可以存取、查询、更新和管理数据的结构化查询语言。尽管如此,由关系型数据库管理的结构化数据只占现实世界中数据总量的20%。大量的非结构化数据不但是一个正待挖掘的数据金矿,还将以飞快的速度增长。
海量医学影像数据的涌现
我国人口基数庞大,据国家统计局第六次全国人口普查主要数据公报,全国总人口数约为13.7亿。生老病死是人类永恒的规律,俗话说人吃五谷杂粮,哪有不生病的,何况中国已经进入了人口老龄化快速发展的阶段,中国老龄委办公室常务副主任陈传书在“2012年中国老龄工作会议”上表示,2011年底,中国60岁以上老年人口为1.85亿,占总人口的13.7%,预计2013年将突破2亿,2033年将突破4亿。不管是儿童、年轻人、中年人还是老年人,生病了都需要去医院就医,而医学影像作为一个重要的诊断依据在现代医学中占据了不可或缺的地位。
人体的很多器官都是无法直接用肉眼看见的,最早医生只能通过叩诊法或者听诊器来判断病情,但是随着医学成像技术的进步,医生可以通过X射线、CT和超声波“窥探”人体内部的病变,为正确的诊断提供更可靠的依据。病人甚至可以通过服用一个带摄像头的胶囊来给消化道拍照,并将图像无线传输到体外的接收器,最后随粪便排出体外。目前这种胶囊内镜的拍照速度已经达到2秒/张,电池的工作时间达6-8小时,一次诊断完成便可以拍摄成千甚至上万的照片,如此看来海量医学影像数据爆炸的时代怎么能不到来呢?
医学影像归档和通信系统
医学影像归档和通信系统(PACS)是放射学、影像医学、数字化图像技术、计算机技术及通信技术的结合。它将医学图像资料转化为数字形式,并通过高速计算设备及通讯网络完成对图像信息的采集、存储、管理、处理及传输等功能,有效管理和充分利用医学影像。它可以从多种影像设备或数字化设备中采集图像、在医院内各科室之间快速传输图像数据、远程传输图像及诊断报告。PACS最初主要用于放射科,现在PACS已经从简单的几台放射影像设备之间的图像存储与通信,扩展至医院所有影像设备乃至不同医院影像之间的相互操作。PACS在中国的发展相对较晚,但是对我国医疗卫生事业的发展和医疗卫生信息化建设却起到了举足轻重的作用。随着我国经济社会的发展,老百姓对生活品质的要求越来越高,愈加重视健康状况,庞大的需求和有限的优质医疗资源之间形成了矛盾。通过建立区域影像信息服务平台,患者在任何医院拍摄的影像资料,都可以在其他医院调阅到,通过远程医疗会诊平台,市民可以在家门口的基层医疗卫生机构享受到三甲医院专家的诊疗服务,有效的解决了看病难、看病贵的问题。
医学影像的存储和传输仍面临挑战
首先,要建立统一的通讯标准。PACS需要同医院所有的影像设备连接,还需要同其他信息系统进行数据交换和整合,比如HIS系统。而在一家现实的医院中,这些影像设备是由不同厂家生产的,系统可能是单独建设的,采用不同的架构,因此具有异构性,为保证数据在这些不同的影像设备和信息系统之间整合和交换,必须统一通讯标准。其次,要减少医学影像在压缩过程中的损失。医学影像资料所占的存储空间大,因此在存储和传输的过程中需要压缩,但如果压缩后图像失真,则会对诊断的准确性产生影响,可能会因为误诊使病人失去最佳的治疗窗口。最后,对存储介质和存储架构提出新的要求。前面提到了医学影像很大,因此会延长读取的时间,如果医生5分钟都不能看到病人的影像资料,可能会非常烦躁,因此对于存储介质的I/O速度又提出了新的要求,但是I/O越快的介质成本越高,因而又对存储架构提出了新的要求。用固态硬盘存储最新的数据,用磁带存储好久不用的数据是一种常用的方法,还可以采用虚拟化云存储架构来动态调配资源解决这个问题。另外,专用医学影像数据库管理系统的开发和庞大医学影像资料的模糊检索也是一个亟待解决的问题。
建立医学影像共享平台
医学在实践中发展进步。无论是国粹中医的“望、闻、问、切”,还是西医的叩诊法、解剖学以及利用各种仪器来解构人体,都是历代医生在行医过程中对具体问题的剖析和判断,并在此基础上总结和认识规律。尽管现代医学已经形成自己的一套理论体系,但理论是死的,人是活的,两个病人的相同病状可能是由一个或多个不同的原因引起的,因此一个优秀的医生必须不断在临床实践中细心观察,利用理论知识联想可能病因,并辅以医学检查所获得的影像资料做出正确的诊断。一个勤奋和努力的医生,可能不满足只研究本院病人的情况,还想研究其他医院收治病人的情况,甚至跨科室病人的情况,那么如果没有建立一个资源共享的平台,想要达到这个目的的时间、精力和金钱成本是很高的。因此建立一个集成病人电子病历和医学影像资料的共享平台是十分必要的。
除了帮助医生进行科学研究外,这样的平台还可以帮助医生详细了解病人的基本健康状况,过往病史、过敏史,利用历史资料科学、精确的替病人“把脉”并降低医疗中发生风险的概率。
一个有效的电子病历和医学影像资料共享平台的特征必然是开放的,互联的,而不是封闭的,割裂的。在建立一个全国的共享平台存在资金和各方协调困难的情况下,可以先从建立区域医疗电子病历和医学影像资料共享平台开始。
沃森,医生的好帮手
尽管医生可以利用共享资源平台对病人的病情进行挖掘,但仍然是利用人脑的分析和思考能力。IBM公司的超级计算机“沃森”似乎已经可以像医生一样“思考”了。继在美国著名智力竞答电视节目《危险边缘》中战胜了两名最优秀的人类选手之后,沃森又向成为一名医生迈进了一步。沃森的“头脑”里已经存储了大量的各式各样的信息,并和美国联邦政府要求医院建立的医疗电子记录相连,研究人员还向其输入各种医学工具书、临床诊断手册和医学杂志,沃森甚至可以利用病人在Facebook和Twitter上发布和关注的信息。沃森在诊断虚拟病人时表现良好,达到了73%的准确度,并可以为同一疾病的不同病人提供个性化的治疗方案。目前,美国哥伦比亚大学医疗中心和马里兰大学医学院已经和IBM公司签订合同,医疗人员将利用沃森更快、更精确的诊病、治病。IBM还和美国俄亥俄州克利夫兰的一家医院签署了协议,计划将沃森投入到医生的培训工作中去,医学专业的学生将努力改进沃森对医学语言的理解和分析能力,达到共同提高的目的。
结语
总之,智慧医疗正为我们描绘一幅美妙的图景:人们的身上佩戴着收集身体健康数据的传感器——使用最新的材料,前卫并时髦。数据通过无线网络传输到超级计算机医生的“大脑”里,计算机医生对每个人的历史健康数据——包括就医记录、电子病历和医学影像——进行挖掘、对比和分析,对异常的身体健康数据发出警告,提醒人们注意,并向急救中心自动发出警报,如果数据显示这个人的心跳正在消失的话。
非结构化数据正在激增
非结构化数据正在激增!非结构化数据无法用二维表结构来逻辑表达,因此不适合在目前依然是主流的关系型数据库中管理,它们大多以文件的形式保存,我们每天访问的网页、有感而织的“围脖”、在社交网站上分享的照片和在视频网站欣赏的电影都是一种非结构化数据。医疗影像数据也是一种非结构化的数据。
每天都有成千上万的数据在产生。人类的思维活动会产生数据,比如写微博、计算机辅助绘制图纸、创作音乐;大自然也会产生数据,比如通过传感器采集的温度、湿度、风速。但是只有经过分析处理的数据才称的上是信息,才具有价值,数据库管理系统的意义就在于能够更好的组织、存储和管理数据,为此科学家们还发明了可以存取、查询、更新和管理数据的结构化查询语言。尽管如此,由关系型数据库管理的结构化数据只占现实世界中数据总量的20%。大量的非结构化数据不但是一个正待挖掘的数据金矿,还将以飞快的速度增长。
海量医学影像数据的涌现
我国人口基数庞大,据国家统计局第六次全国人口普查主要数据公报,全国总人口数约为13.7亿。生老病死是人类永恒的规律,俗话说人吃五谷杂粮,哪有不生病的,何况中国已经进入了人口老龄化快速发展的阶段,中国老龄委办公室常务副主任陈传书在“2012年中国老龄工作会议”上表示,2011年底,中国60岁以上老年人口为1.85亿,占总人口的13.7%,预计2013年将突破2亿,2033年将突破4亿。不管是儿童、年轻人、中年人还是老年人,生病了都需要去医院就医,而医学影像作为一个重要的诊断依据在现代医学中占据了不可或缺的地位。
人体的很多器官都是无法直接用肉眼看见的,最早医生只能通过叩诊法或者听诊器来判断病情,但是随着医学成像技术的进步,医生可以通过X射线、CT和超声波“窥探”人体内部的病变,为正确的诊断提供更可靠的依据。病人甚至可以通过服用一个带摄像头的胶囊来给消化道拍照,并将图像无线传输到体外的接收器,最后随粪便排出体外。目前这种胶囊内镜的拍照速度已经达到2秒/张,电池的工作时间达6-8小时,一次诊断完成便可以拍摄成千甚至上万的照片,如此看来海量医学影像数据爆炸的时代怎么能不到来呢?
医学影像归档和通信系统
医学影像归档和通信系统(PACS)是放射学、影像医学、数字化图像技术、计算机技术及通信技术的结合。它将医学图像资料转化为数字形式,并通过高速计算设备及通讯网络完成对图像信息的采集、存储、管理、处理及传输等功能,有效管理和充分利用医学影像。它可以从多种影像设备或数字化设备中采集图像、在医院内各科室之间快速传输图像数据、远程传输图像及诊断报告。PACS最初主要用于放射科,现在PACS已经从简单的几台放射影像设备之间的图像存储与通信,扩展至医院所有影像设备乃至不同医院影像之间的相互操作。PACS在中国的发展相对较晚,但是对我国医疗卫生事业的发展和医疗卫生信息化建设却起到了举足轻重的作用。随着我国经济社会的发展,老百姓对生活品质的要求越来越高,愈加重视健康状况,庞大的需求和有限的优质医疗资源之间形成了矛盾。通过建立区域影像信息服务平台,患者在任何医院拍摄的影像资料,都可以在其他医院调阅到,通过远程医疗会诊平台,市民可以在家门口的基层医疗卫生机构享受到三甲医院专家的诊疗服务,有效的解决了看病难、看病贵的问题。
医学影像的存储和传输仍面临挑战
首先,要建立统一的通讯标准。PACS需要同医院所有的影像设备连接,还需要同其他信息系统进行数据交换和整合,比如HIS系统。而在一家现实的医院中,这些影像设备是由不同厂家生产的,系统可能是单独建设的,采用不同的架构,因此具有异构性,为保证数据在这些不同的影像设备和信息系统之间整合和交换,必须统一通讯标准。其次,要减少医学影像在压缩过程中的损失。医学影像资料所占的存储空间大,因此在存储和传输的过程中需要压缩,但如果压缩后图像失真,则会对诊断的准确性产生影响,可能会因为误诊使病人失去最佳的治疗窗口。最后,对存储介质和存储架构提出新的要求。前面提到了医学影像很大,因此会延长读取的时间,如果医生5分钟都不能看到病人的影像资料,可能会非常烦躁,因此对于存储介质的I/O速度又提出了新的要求,但是I/O越快的介质成本越高,因而又对存储架构提出了新的要求。用固态硬盘存储最新的数据,用磁带存储好久不用的数据是一种常用的方法,还可以采用虚拟化云存储架构来动态调配资源解决这个问题。另外,专用医学影像数据库管理系统的开发和庞大医学影像资料的模糊检索也是一个亟待解决的问题。
建立医学影像共享平台
医学在实践中发展进步。无论是国粹中医的“望、闻、问、切”,还是西医的叩诊法、解剖学以及利用各种仪器来解构人体,都是历代医生在行医过程中对具体问题的剖析和判断,并在此基础上总结和认识规律。尽管现代医学已经形成自己的一套理论体系,但理论是死的,人是活的,两个病人的相同病状可能是由一个或多个不同的原因引起的,因此一个优秀的医生必须不断在临床实践中细心观察,利用理论知识联想可能病因,并辅以医学检查所获得的影像资料做出正确的诊断。一个勤奋和努力的医生,可能不满足只研究本院病人的情况,还想研究其他医院收治病人的情况,甚至跨科室病人的情况,那么如果没有建立一个资源共享的平台,想要达到这个目的的时间、精力和金钱成本是很高的。因此建立一个集成病人电子病历和医学影像资料的共享平台是十分必要的。
除了帮助医生进行科学研究外,这样的平台还可以帮助医生详细了解病人的基本健康状况,过往病史、过敏史,利用历史资料科学、精确的替病人“把脉”并降低医疗中发生风险的概率。
一个有效的电子病历和医学影像资料共享平台的特征必然是开放的,互联的,而不是封闭的,割裂的。在建立一个全国的共享平台存在资金和各方协调困难的情况下,可以先从建立区域医疗电子病历和医学影像资料共享平台开始。
沃森,医生的好帮手
尽管医生可以利用共享资源平台对病人的病情进行挖掘,但仍然是利用人脑的分析和思考能力。IBM公司的超级计算机“沃森”似乎已经可以像医生一样“思考”了。继在美国著名智力竞答电视节目《危险边缘》中战胜了两名最优秀的人类选手之后,沃森又向成为一名医生迈进了一步。沃森的“头脑”里已经存储了大量的各式各样的信息,并和美国联邦政府要求医院建立的医疗电子记录相连,研究人员还向其输入各种医学工具书、临床诊断手册和医学杂志,沃森甚至可以利用病人在Facebook和Twitter上发布和关注的信息。沃森在诊断虚拟病人时表现良好,达到了73%的准确度,并可以为同一疾病的不同病人提供个性化的治疗方案。目前,美国哥伦比亚大学医疗中心和马里兰大学医学院已经和IBM公司签订合同,医疗人员将利用沃森更快、更精确的诊病、治病。IBM还和美国俄亥俄州克利夫兰的一家医院签署了协议,计划将沃森投入到医生的培训工作中去,医学专业的学生将努力改进沃森对医学语言的理解和分析能力,达到共同提高的目的。
结语
总之,智慧医疗正为我们描绘一幅美妙的图景:人们的身上佩戴着收集身体健康数据的传感器——使用最新的材料,前卫并时髦。数据通过无线网络传输到超级计算机医生的“大脑”里,计算机医生对每个人的历史健康数据——包括就医记录、电子病历和医学影像——进行挖掘、对比和分析,对异常的身体健康数据发出警告,提醒人们注意,并向急救中心自动发出警报,如果数据显示这个人的心跳正在消失的话。