基于大数据的临床科研分析平台设计与实现

来源 :健康体检与管理 | 被引量 : 0次 | 上传用户:xb_wonder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】目的 本文旨在构建一个安全、可靠、稳定、能同时解决历史数据和实时数据读写速度快、响应效率高的医疗科研大数据挖掘平台,提高医生科研效率和能力。方法 采用大数据、知识图谱、机器学习等人工智能相关技术,通过ETL工具整合多源异构数据,形成临床科研大数据中心和数据挖掘分析平台。 结果 建设成全院级科研平台和三个临床专病数据中心。 结论 提高科研效率和能力,加速科研成果转化,提升医院的高质量发展。
  【关键词】大数据;科研平台;ETL工具;数据分析
  本文系2021年江苏省医院协会医院管理创新研究课题《面向挖掘的肺癌数据库及机器学习算法构建免疫检查点抑制剂相关胃肠道不良反应的预测模型研究》(课题编号: JSYGY-3-2021-483)研究成果
  1 引言
  随着大数据、人工智能等技术的迅速发展,医疗卫生领域已迎来“大数据时代”,正在对科研卫生领域起着积极的作用。为加强健康医疗大数据服务管理,促进“互联网+医疗健康”发展,充分发挥健康医疗大数据作为国家重要基础性战略资源的作用,2016年国务院办公厅印发《关于促进和规范健康医疗大数据应用发展的指导意见》,文中指出努力建设人民满意的医疗卫生事业,为打造健康中国提供有力支撑。2018年,《关于促进“互联网+医疗健康”发展的意见》提出了促进互联网与医疗健康深度融合发展的一系列政策措施。以上政策文件为健康医疗大数据标准、安全和服务管理制定办法,鼓励推进科研大数据应用,提升医学科研能力,进而推动智慧医疗、智慧医院的发展与建设[1]。
  科研分析、数据统计已经成为临床医生日常工作中非常重要的一部分,然而,每天的临床业务占据了医生的大量时间,使得医生在科研方面投入的精力有限。以往在进行科研分析时,需要人工收集大量病例进行筛选,不仅浪费人力和时间而且会造成数据量偏少、数据不完整、结果不准确等问题,严重影响科研统计分析,为打破数据壁垒,让海量的医学数据为科研、临床决策支持所用,构建一个数据安全、可靠、高效的医疗科研大数据挖掘分析平台迫在眉睫。
  2 平台总体架构
  构建全院级科研数据中心,主要集成了病人的诊断、检验、检查、病理、用药以及电子病历中的入院记录、病程录、出院小结等临床数据。数据的采集、调度、监控通过数据治理平台进行管控,数据治理平台能实现可視化配置操作,支持多种数据源,如DB格式、CSV、TXT等文件接口方式[2]。
  我院大数据科研平台以数据仓库为核心,实现大数据技术在临床科研领域的落地,平台的总体架构主要包括:数据层、数据存储层、接口服务层、平台应用层。首先,平台从医院业务系统中抽取出科研所需数据,继而利用计算存储层对抽取的资源进行整合、清洗、转化,构建疾病模型、知识图谱,辅助进行统计分析、数据挖掘和疾病预测等科研应用。
  2.1 数据清洗 从数据源中抽取的数据不一定完全满足目的库的要求,如数据格式的不一致、数据输入错误、数据不完整等,因此有必要对抽取出的数据进行数据清洗。清洗过程需统一统计指标单位、统一统计指标周期以及统一标准的临床术语等。
  2.2数据整合 根据疾病的演变和诊疗过程,参考HL7 V3 RIM模型、CCR等标准来进行灵活构建模型,同种业务类型的数据进行归类标准化汇集。整合过程统一编码、统一字典、统一数据格式,确保数据的一致性和完整性。
  由于医疗机构内部的业务系统种类繁多,导致在异构系统的集成上存在很多的问题和瓶颈。平台通过CDC数据变更捕获技术,可以让用户将数据源服务器上的数据发布到不同的服务器上,并且可以确保不同地点的数据自动同步更新,使得不同的服务器用户在权限许可的范围内就可以共享同一份数据了。数据仓库的建设需要从各个不同的系统获取数据,平台通过数据库复制技术,将生产服务器上的数据发布到中间服务器上,然后由数据仓库从中间服务器上获取数据,这样就保证了数据仓库进行轮询时,不会影响生产环境的用户。
  2.3 患者主索引服务 患者主索引服务(EMPI)采用特有的技术和算法,用于全院范围内患者基本信息索引的创建、搜索和维护,智能的帮助科研人员对病人信息进行有效检索,获得完整而准确的病人视图。
  3 平台建设成果
  截止目前大数据科研平台上已累积经过规范化处理入库患者数有290余万例,就诊记录数1000余万例,已建立起全院级科研数据中心和三个专病数据中心,切实提高了科研质量和效率。
  平台已开发建成了具有“数据概览、队列发现、特征提取、数据分析、 智能搜索、随访监测、病人360”等功能模块的信息平台,科研人员通过数据概览来了解平台的医疗数据视图,每个视图均可实现列设置、列统计功能以及数据导出功能,熟悉平台底层数据框架后,即可针对科研需求进行队列定义、特征提取,最后进行数据分析,达到科学研究的目的。
  3.1 队列定义 平台提供灵活方便的组合条件进行查询筛选和多维度的诊疗数据检索,可以快速地找到科研病例集,最后通过入选和排斥等集合运算实现研究人群的精确筛选。
  3.2 特征提取 支持基准事件的规则设定,基准事件的时间顺序、基础信息、聚合列、计算列等多个组合条件导出数据,且可对需要导出的项目进行函数运算,支持从原始变量生成新的变量,用户对导出的数据进行自由组合,对导出的数据可移至SPSS、SAS等分析软件进行科研统计分析,并且平台支持特征数据的删除、修改、克隆以及相关数据预览等功能。
  4 讨论
  临床科研分析平台是我院医疗大数据在科研方面的应用落地,在系统建设的过程中,应用ETL技术、主索引管理、自然语言结构化、数据脱敏、机器学习等先进技术,为数据的深度挖掘和共享提供基础,准确、便捷、高效地服务临床科研人员,提高科研效率,促进医疗健康事业的发展。
  [参考文献]
  [1] 甘伟, 徐明明, 陈联忠,等. 大数据临床科研平台的设计与实现[J]. 中国数字医学, 2019, 14(2):40-43.
  [2] 王持, 李超, 陈旭,等. 面向医疗临床科研的大数据平台[J]. 集成技术, 2019,8(5):86-96.
其他文献
【摘要】精气是构成世界的本源,人类的生活、生产、学习等活动离不开精气升降出入、与天地精气的交互。如果精气升降出入失常,便会阻碍人体的生长收藏,导致疾病。如果人体自我封闭起来,便会闭塞不通,最终只能乏源而竭,走向困厄和灭亡。  【关键词】精气;升降出入;五脏  中国传统哲学以精气学说解释万物起源及发展变化,认为精气是构成世界的本源。精气是指宇宙中的无形可见、运动不息而又含有巨大能量的极细微物质。中国
期刊
【摘要】中医重传承,师带徒是一种具有不可替代优势的人才培养模式。全国第四批名老中医药卢化平主任医师善于从肝脾论治眩晕,其传承弟子张敏主任医师在继承老师的经验基础上又有所创新。作者有幸跟师于两位专家,受益匪浅。本文即是总结这些学术思想和临床经验,抛砖引玉,以飨同道。  【关键词】中医传承;眩晕  眩晕是指以头晕、目眩为主症的疾病。“眩”是指眼花或眼前发黑;“晕”是指患者自觉平衡力减弱、直立困难,或者
期刊
【摘要】本文就美国最具影响力的美食节目主持人安东尼.波登的自杀事件,分析了波登的成长经历及各阶段的心理状态,从而对这起著名的自杀事件有一个心理学角度的分析,探讨自杀的成因,对自杀的自救、干预及预防提出了可行性建议,为备受自杀困扰的人群及自杀干预的心理治疗师提供策略参考。  【关键词】自杀心理;名人自杀;自杀干预;自杀防御与自救  一、 安东尼.波登自杀事件  2018年6月8日美国知名的美食家、节
期刊
【摘要】目的:探究头孢曲松联合阿奇霉素治疗淋病的效果及免疫功能的影响。方法:将淋病患者作为此次研究的对象,分组方式为电脑随机分组,本次研究人数共60例,对照组采取头孢曲松治疗、观察组采取头孢曲松联合阿奇霉素治疗,并将两组治疗后的各项指标进行对比,以明确效果。结果:观察组起效时间、分泌物改善时间、生化指标改善时间均短于对照组,(P<0.05)。观察组经治疗后,免疫指标水平中FEER(71.25±1.
期刊
【摘要】目的:探究卵巢囊腫经腹腔镜下卵巢囊肿剥除术治疗的临床效果与并发症发生情况。方法:选取2016年7月至2021年7月于我院接受治疗的94例卵巢囊肿患者作为研究对象,根据治疗方法分为传统组与腹腔镜组,各47例,传统组治疗方式为传统开腹手术,腹腔镜组治疗方式为腹腔镜下卵巢囊肿剥除术,对两组治疗总有效率与并发症发生率进行比较分析。结果:腹腔镜组术中出血量较传统组少,首次肛门排气时间及手术时间较传统
期刊
【摘要】目的:探讨危重症脓毒症并发急性肾损伤进展至慢性肾脏病危险因素。方法:将2017年11月至2020年11月我院收治的100例膿毒症患者作为研究对象。通过电脑分组法将其分为参照组和观察组,每组各50例,参照组为非急性肾损伤患者,观察组为急性肾损伤,比较两组患者的一般情况。结果:在100例患者中45例患者并发急性肾损伤,发生率为45%,25例急性肾损伤患者死亡,病死率为55.5%。急性肾损伤患者
期刊
【摘要】目的:探讨连续性血液净化治疗重症急性胰腺炎临床效果分析。方法:2017年9月到2020年9月院收治的60例重症急性胰腺炎作为研究对象。通过电脑分组法将其分为参照和观察组,每组各30例。参照组实施乌司他丁治疗,观察组接受连续血液净化治疗,研究分析两组重症急性胰腺炎的应用效果。结果:观察组的并发症发病率低于参照组,差距具有统计学意义(P<0.05)。观察组效果满意度高于参照组,差距具有统计学意
期刊
我的名字叫“小暖”,最初只是一枚原始卵泡细胞,承担着人类的生育大计,在人类胎儿期我就已经存在了,有着近700多万名同胞,我们有一个共同名字叫“初级卵母细胞”。但我们之中的大部分会逐渐闭锁退化,卵泡发育是一个连续的变化过程,一般分为原始卵泡→初级卵泡→次级卵泡→成熟卵泡四个阶段。人类到新生儿期呱呱坠地时我们大约剩下200万个,到了青春期便只剩下约30万-40万个了。而女性一生当中一般只有400-50
期刊
【摘要】目的:为了深入研究对阴道炎患者实施甲硝唑联合乳酸菌阴道胶囊治疗干预后,患者激素水平。方法:选取我院2020年3月至2021年3月期间收治的阴道炎患者共104例,将其随机分组,给予甲硝唑联合乳酸菌阴道胶囊治疗干预措施组为研究组,给予甲硝唑治疗干预措施组为参照组,研究组和参照组各52例患者。对比两组患者激素水平。结果:干预期结束后,研究组阴道炎患者激素水平显著优于参照组。差异均有统计学意义(P
期刊
【摘要】在骨龄鉴定过程中,腕关节骨骼数量多、体积小、组成复杂且存在骨骺出现和愈合的先后顺序差异,法医学司法鉴定领域常用来进行青少年骨龄鉴定,准确性较高。但我国不同地区不同民族的青少年手腕骨生长发育情况存在差异,我们对近年来国内外部分青少年手腕骨发育相关文献进行搜集整理分析,为相关学者研究我国青少年手腕部关节发育规律提供一些借鉴和研究方向。  【关键词】青少年;手腕部;关节发育  青少年是人体生长发
期刊