面向异构临床信息系统的数据发现方法研究及实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:rdview
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床数据的准确性、完整性与一致性对于回顾性临床研究的开展具有重要价值,而目前从医院异构临床信息系统中对目标临床数据的检索主要基于原始数据库文档手动完成,具有效率低下且数据质量难以保证等缺点。数据发现是指从各种异构数据库收集元数据并将其整合到可以方便即时评估的单一来源的过程,而元数据可以从不同维度描述临床信息系统原始数据,让用户充分理解和洞察原始数据,从而准确并完整地定位目标临床数据。因此利用数据发现可以辅助研究人员快速完成目标临床数据的检索与获取,保证临床回顾性研究的临床数据质量。本研究设计和实现了一个面向复杂异构临床信息系统的数据发现方法。首先根据临床信息系统的业务场景和临床通用数据模型OMOP CDM的设计定义了元数据的自身结构,共包含基础元数据、数据语义信息、数据关联信息,其中元数据以列为单位进行数据描述。然后基于中文临床医学术语设计了一个临床术语语义网络用于从临床信息系统原始数据中获取数据语义信息,使用集合包含、Jaccard Containment和Jaccard Similarity等方法获取数据关联信息。最后开发一个Web端应用,用于对自动提取的元数据信息进行可视化和可交互导航,提供元数据的浏览、搜索、推荐等功能。通过将本研究设计的数据发现方法在两家医院的真实临床信息系统上实际应用,基础元数据显示两个临床信息系统的数据结构是完全不一致的,评估数据显示原始临床数据的语义信息准确率均能达到90%,覆盖率均能达到85%;数据关联分析中70%以上的列能获得关联信息,其中主键关联和外键关联的准确率能达到80%,并且在扫描的数据中全部覆盖。因此上述数据表明本研究提出的数据发现方法可以适用于真实的异构临床信息系统,且对临床信息系统元数据的提取具有较高的准确率和覆盖率,能够在缺失数据库文档等先验信息的条件下较好的描述临床信息系统的原始数据,这对于目标临床数据检索效率、准确性和完整性的提高具有重要意义与价值。
其他文献
近年来,数码印花在纺织品印花产业种所占的市场比例正在逐步上升,需求的不断增长也使得对印花质量要求越来越高。实际生产过程中,数码印花会出现多种多样印花缺陷,如深浅道、颜色不均、墨渍、模糊、步进道条纹等。人工检测印花缺陷会因注意力无法长时间集中、视觉跟不上印花印刷速度等原因导致检测率较低。此外,虽然基于机器学习的缺陷检测算法在纯色布上的缺陷检测较为成熟,但数码印花由于图案复杂多样,当前的检测算法无法满
学位
新加坡自1965年取得独立以来,克服了国土面积狭小、自然资源匮乏等困境,实现了经济、政治、社会全方位的发展,支撑其繁荣发展的政治基础是人民行动党长期执政、政府主导国家经济发展的威权政治体制。随着全球民主化浪潮的不断推进,虽然新加坡的威权政治体制面临着一系列挑战,但其仍旧保持着良好的国家治理效果和发展态势。笔者通过构建一种民主测量方式对新加坡民主进行测量,以确定其政治制度的民主程度,找出其民主制度中
学位
对活细胞内的亚细胞结构,如微管、囊泡等的动态活动特征进行定量分析,对于理解细胞的生物学规律至关重要。随着光学与计算机技术的快速发展,先进的荧光显微成像技术使得特异性标记细胞内的特定结构和动态观测细胞中的生命活动成为可能。在获取大量包含丰富生物医学信息的时序图像的同时,我们也面临着如何高效准确地处理这些数据并从中提取出有效信息的新挑战。受显微图像信噪比、时空分辨率参差等因素的限制,传统的图像处理和分
学位
脑机接口(BCI)以大脑生理信号作为初始信号,提取意图信息,识别和控制外周设备,实现大脑与外部设备间的信息通信交流。由于电生理技术存在空间稀疏性等限制,光学钙成像技术正广泛被神经科学家应用于特定神经元活动的高空间分辨率长期记录。然而,钙成像技术应用于脑机接口实践,仍然面临巨大挑战。目前,钙成像采集设备功能单一,缺少实时处理等功能;没有成熟的实验平台支持钙成像技术在脑机接口的研究应用;现有的钙成像处
学位
金属氧化物作为常见的紫外敏感材料,具有高灵敏度、低成本、性能稳定和纳米结构多样等优势。目前,阻碍此类材料在柔性穿戴式紫外传感器中应用的瓶颈主要在于其修饰工艺的复杂性。传统工艺将金属氧化物材料修饰于传感器基底的过程繁琐,难以保证器件的一致性与稳定性,因而批量化生产难度大。微纳打印作为一种新型增材制造工艺,具有高通量、低成本和步骤简单等优势,在传感器制备中得到了广泛应用,但是面向微纳打印工艺开发用于柔
学位
将詹姆斯·莫罗的“自主-安全交易”模型在多边不对称联盟中进行了拓展性研究。本文重点关注联盟的实力组合结构对非主导国在不对称联盟中的相对自主性获取差异。以联盟常规武器贸易网络作为成员国间实力对比结构的代理变量,运用社会网络分析法(SNA)对北约和华约这两大联盟实力结构的不对称程度进行了量的测量,并结合核力量在联盟内部的分布状况来对北约和华约的不对称类型进行了质的界定。在控制了权力与威胁制衡需求、防止
学位
目的 探讨妇科肿瘤的优质护理服务措施及护理效果。方法 选择72例妇科肿瘤患者,根据随机数字表法分为对照组与观察组,每组36例。对照组给予常规护理,观察组给予优质护理服务。比较两组护理满意度、心理状态、睡眠质量、生活质量、自我效能感、疼痛情况。结果 观察组护理满意度高于对照组,差异有统计学意义(P<0.05)。护理前,两组焦虑自评量表(SAS)、抑郁自评量表(SDS)评分比较,差异无统计学意义(P>
期刊
血流动力学参数的监测对临床心血管疾病诊断、围手术期监测具有重要意义,同时,无创血流动力学参数监测也是载人航天任务中航天员健康监测的重要组成部分。论文研究了一种基于心电和归一化光电容积脉搏波的无创连续血流动力学参数监测方法,实施了20个临床手术过程,将自研仪器与有创方法得到的数据进行对比,重点研究了逐搏血压和心输出量这两个基础血流动力学参数的测量精度。本论文的主要研究内容工作包括:1.整合课题组所使
学位
密集场景下的人群检测是计算机视觉领域的重要任务之一,它要求预测头部外接矩形框。在目前的研究中,通过对大量数据进行完全标注提高检测算法性能,其较高的标注成本难以应用于实际场景,同时图像中重叠目标和小目标的少量信息导致检测过程中误检和漏检增加。针对上述问题,本文基于半监督学习在伪标签生成算法和密集人群检测算法上进行了研究。本文研发了一种密集人群数据集伪标签生成算法,采用半监督目标检测中的自学习方法离线
学位
阐述职业教育计算机课程的教学特点,“互联网+工学一体化"教学模式的实践过程,包括结合项目要求安排学习任务,运用互联网对学习成果进行评价,分阶段设计教学过程。
期刊