论文部分内容阅读
【摘要】近年来医疗卫生信息化发展迅速,医疗卫生领域也迎来了大数据时代的潮流。简述了医疗卫生系统中数据资源现状,分析了通过大数据平台构建临床决策支持系统、提高医药产品研发效率、疾病监控防治等方面的应用前景。
【关键词】大数据 医疗卫生系统
1数据管理问题
医疗数据是持续、大量增长的大数据。根据估算,中国一个中等城市50年所积累的医疗数据量就会达到10PB级。并且,随着时间的推移和业务系统的不断升级换代,医疗数据模式的一致性也无法保证。因此,每天都会有大量的数据持续不断地导入区域医疗数据中心,并且每当有数据模式的更改,相关的历史数据也需要做相应的调整。由于医疗数据是多种数据源数据的汇总,医疗数据是关系复杂的多维数据。医疗数据的多维度多粒度为各种信息服务的多角度多层次分析提供了可能,但同时也为大数据分析带来了挑战。Hadoop基于开源分布式数据处理平台,通过特殊的方式组织网络级数据,可以解决数据存储水平扩展的挑战。利用MapReduce并行处理批量事务的能力,从多个数据源(主要是医疗机构的各个业务系统)抽取数据、转换格式、并导入基于HBase的数据存储模型。使用Hadoop进行多维分析,利用数据平台中多维数据非结构化的特征,将大量冗余的维度信息整合到事实表中,可以在冗余维度下灵活地改变问题分析的角度。并结合Hadoop,MapReduce强大的并行化处理能力,无论分析中的维度增加多少,开销并不显著增长,不会显著影响分析的性能。
2大数据应用
2.1构建临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。通过分析疾病的模式和趋势,临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。共享的医疗大数据分析技术将使临床决策支持系统更智能,首先,大数据中心存储的海量、高维和非结构化的数据能够被检索,由于对非结构化数据的分析能力的日益加强,从而获取更多的决策支持信息。比如可以使用图像分析和识别技术,识别医疗影像(X光、CT、MRI)数据,结合患者的电子病历信息,得到辅助的治疗信息。或者挖掘医疗文献数据建立医疗专家数据库和医学知识仓库,为医生提供一个决策和清单,在录入症状和检验结果后,做是非判断等集合算法,根据不同病种,建立决策树算法,逐渐得出诊断结果和治疗方案,为医生的临床操作提供建议,防止医生忽略可能存在的罕见疾病,防止误诊。此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,将常规的医生问诊程序化和模式化,结合检验化验等技术手段,医生只需参与最后的决策和治疗环节。使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。
2.2提高医药产品研发效率
2.2.1预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。除了研发成本,医药公司还可以更快地得到回报。通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,有更高潜在市场回报和治疗成功率的药物。
2.2.2提高临床试验设计的统计工具和算法
使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
2.2.3临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
2.3基于大数据的疾病监控防治
大数据的使用可以改善公众健康监控。首先,随着移动互联网现在的不断发展,越来越多的用户开始选择把业务和使用习惯都转移到了移动端,那么,在基于海量数据用户搜索的社交APP以及LBS等技术层面,可以建立结合原有疾病监控系统中的流行疾病法定报告数据、流行疾病病例,结合疾病、环境数据,及时发现并绘制出流行病风险地图。在基于搜索数据和LBS数据方面,分析不同时空尺度人口流动性、移动模式和参数进一步结合病原学、人口统计学、地理、气象和人群移动迁徙、地域之间等因素和信息,建立流行病时空传播模型,确定流感等流行病在各流行区域间传播的时空路线和规律,得到更加准确的态势评估、预测。并且,通过医疗云和大数据中心,公共卫生部门可以通过覆盖全国的患者电子病历数据库,分析疾病的模式和趋势快速检测大规模传染性疾病进行全面的疫情监测,并通过集成疾病监测和响应程序,快速采取措施进行响应。这基于大数据的疾病监控防治能使传染病感染率降低,卫生部门可以更快地检测出新的传染病和疫情。通过提供准确和及时的公众健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染风险。大数据共享在疾病监控防治中可以做到以下几点:
(1)提前确定一定规模的未知疾病,为疫情控制争取时间。传统检测无法监测到任何没有临床症状的病例的,这些经验在医院的临床经验中都是空白。但大數据可以通过医院的共享信息以及搜索监控指定地区的用户的频繁搜索关键词,可以检测到某个地区已经出现的疫情。比如不明原因的肺炎,某地餐馆让多少人出现呕吐腹泻等异常状况等,然后再通过与疾病控制中心的病毒库中的病毒分析,寻找吻合的病毒,进行比对分析将其找出,为判断疾病赢取时间。建立大数据中心后,疾病预防可以真正在第一时间内去判断出疫情的病毒源,进而为控制争取时间。疾病监控防治的目的是及时制止其传播的范围,而大数据则是目前唯一的也是最佳的途径。
(2)判断人员流向,控制疫情。在疫情发生后,虽然国家可以第一时间控制住当地疫情,但是人员流动则是无法控制的。利用大数据的监控分析就能监测到传染源区人员的主要流向目的地,疾控中心可以拿出对应的医疗技术和对应的治疗药品以及疫苗来防治,第一时间赶到相应地点,实施接种疫苗,这样一来就减少了盲目的广撒网式的全面布局情况,通过大数据分析的提供人员流动数据,让控制疫情在效率上大幅度提升。
(3)传播动力学模型建立。拥有了大数据的全面监控后,疾控中心也就有了更多的实践支持,就可以开始真正从实践中建立有关疫情的复杂动态网络的传播动力学。
参考文献
[1]李国杰,程学旗.大数据研究未来科技及经济社会发展的重大战略领域-大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657.
[2]郑西川,孙宇,于广军,等.基于物联网的智慧医疗信息化10大关键技术研究[J].医学信息学杂志,2013,(1):10-14.
【关键词】大数据 医疗卫生系统
1数据管理问题
医疗数据是持续、大量增长的大数据。根据估算,中国一个中等城市50年所积累的医疗数据量就会达到10PB级。并且,随着时间的推移和业务系统的不断升级换代,医疗数据模式的一致性也无法保证。因此,每天都会有大量的数据持续不断地导入区域医疗数据中心,并且每当有数据模式的更改,相关的历史数据也需要做相应的调整。由于医疗数据是多种数据源数据的汇总,医疗数据是关系复杂的多维数据。医疗数据的多维度多粒度为各种信息服务的多角度多层次分析提供了可能,但同时也为大数据分析带来了挑战。Hadoop基于开源分布式数据处理平台,通过特殊的方式组织网络级数据,可以解决数据存储水平扩展的挑战。利用MapReduce并行处理批量事务的能力,从多个数据源(主要是医疗机构的各个业务系统)抽取数据、转换格式、并导入基于HBase的数据存储模型。使用Hadoop进行多维分析,利用数据平台中多维数据非结构化的特征,将大量冗余的维度信息整合到事实表中,可以在冗余维度下灵活地改变问题分析的角度。并结合Hadoop,MapReduce强大的并行化处理能力,无论分析中的维度增加多少,开销并不显著增长,不会显著影响分析的性能。
2大数据应用
2.1构建临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。通过分析疾病的模式和趋势,临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。共享的医疗大数据分析技术将使临床决策支持系统更智能,首先,大数据中心存储的海量、高维和非结构化的数据能够被检索,由于对非结构化数据的分析能力的日益加强,从而获取更多的决策支持信息。比如可以使用图像分析和识别技术,识别医疗影像(X光、CT、MRI)数据,结合患者的电子病历信息,得到辅助的治疗信息。或者挖掘医疗文献数据建立医疗专家数据库和医学知识仓库,为医生提供一个决策和清单,在录入症状和检验结果后,做是非判断等集合算法,根据不同病种,建立决策树算法,逐渐得出诊断结果和治疗方案,为医生的临床操作提供建议,防止医生忽略可能存在的罕见疾病,防止误诊。此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,将常规的医生问诊程序化和模式化,结合检验化验等技术手段,医生只需参与最后的决策和治疗环节。使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。
2.2提高医药产品研发效率
2.2.1预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。除了研发成本,医药公司还可以更快地得到回报。通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,有更高潜在市场回报和治疗成功率的药物。
2.2.2提高临床试验设计的统计工具和算法
使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
2.2.3临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
2.3基于大数据的疾病监控防治
大数据的使用可以改善公众健康监控。首先,随着移动互联网现在的不断发展,越来越多的用户开始选择把业务和使用习惯都转移到了移动端,那么,在基于海量数据用户搜索的社交APP以及LBS等技术层面,可以建立结合原有疾病监控系统中的流行疾病法定报告数据、流行疾病病例,结合疾病、环境数据,及时发现并绘制出流行病风险地图。在基于搜索数据和LBS数据方面,分析不同时空尺度人口流动性、移动模式和参数进一步结合病原学、人口统计学、地理、气象和人群移动迁徙、地域之间等因素和信息,建立流行病时空传播模型,确定流感等流行病在各流行区域间传播的时空路线和规律,得到更加准确的态势评估、预测。并且,通过医疗云和大数据中心,公共卫生部门可以通过覆盖全国的患者电子病历数据库,分析疾病的模式和趋势快速检测大规模传染性疾病进行全面的疫情监测,并通过集成疾病监测和响应程序,快速采取措施进行响应。这基于大数据的疾病监控防治能使传染病感染率降低,卫生部门可以更快地检测出新的传染病和疫情。通过提供准确和及时的公众健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染风险。大数据共享在疾病监控防治中可以做到以下几点:
(1)提前确定一定规模的未知疾病,为疫情控制争取时间。传统检测无法监测到任何没有临床症状的病例的,这些经验在医院的临床经验中都是空白。但大數据可以通过医院的共享信息以及搜索监控指定地区的用户的频繁搜索关键词,可以检测到某个地区已经出现的疫情。比如不明原因的肺炎,某地餐馆让多少人出现呕吐腹泻等异常状况等,然后再通过与疾病控制中心的病毒库中的病毒分析,寻找吻合的病毒,进行比对分析将其找出,为判断疾病赢取时间。建立大数据中心后,疾病预防可以真正在第一时间内去判断出疫情的病毒源,进而为控制争取时间。疾病监控防治的目的是及时制止其传播的范围,而大数据则是目前唯一的也是最佳的途径。
(2)判断人员流向,控制疫情。在疫情发生后,虽然国家可以第一时间控制住当地疫情,但是人员流动则是无法控制的。利用大数据的监控分析就能监测到传染源区人员的主要流向目的地,疾控中心可以拿出对应的医疗技术和对应的治疗药品以及疫苗来防治,第一时间赶到相应地点,实施接种疫苗,这样一来就减少了盲目的广撒网式的全面布局情况,通过大数据分析的提供人员流动数据,让控制疫情在效率上大幅度提升。
(3)传播动力学模型建立。拥有了大数据的全面监控后,疾控中心也就有了更多的实践支持,就可以开始真正从实践中建立有关疫情的复杂动态网络的传播动力学。
参考文献
[1]李国杰,程学旗.大数据研究未来科技及经济社会发展的重大战略领域-大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657.
[2]郑西川,孙宇,于广军,等.基于物联网的智慧医疗信息化10大关键技术研究[J].医学信息学杂志,2013,(1):10-14.