论文部分内容阅读
健康管理结合科学的管理方式对个体的身体指标进行监测,主要用以疾病预判、健康干预以及医学研究。由于健康管理系统中检测指标较多、数据规模庞大、处理流程复杂,同时缺少标准化规范,使得数据的结果不易理解和判断,导致对个体健康干预和深层次医学研究的难度增加。本文采用数据起源的可视化方法,记录健康数据的处理过程,从而研究数据结果可解释性的问题。在个人大数据和工作流相结合的环境中,健康管理系统存在多样的指标和大量的数据,经过复杂处理后得到量化结果的可信性、可靠性无法保证。目前健康数据的分析和管理工作集中在数据的应用层面,对数据处理过程及数据结果可信性和可靠性的研究较为短缺。在数据挖掘和工作流等领域,数据起源方法在结果可解释性方面已经得到了应用。通过数据起源模型完整地记录健康管理系统中数据处理的流程,并用可视化的形式提供可解释性方案,有助于数据处理结果评估,从而支持健康大数据的更深入分析和研究以及医学领域的相关应用。本文通过使用数据起源的PROV模型,对健康数据的处理流程进行建模,并研究了健康数据处理的可视化方案,为数据分析工作提供支持。具体内容如下:1)介绍了健康管理和数据起源的研究历程,分析了现有健康管理模式的特点和问题,并结合数据起源的特点,提出可以用数据起源解决的健康数据处理存在的关键问题。2)建立了基于PROV的健康管理系统中数据处理的起源模型,设计了健康数据处理的起源信息管理框架,整理了场景对应的起源词汇,制定起源信息管理以及可视化方案。分析了健康管理系统中方法调用日志文件并收集起源信息,使用ProvValidator对RDF格式的起源信息进行有效性校验,通过ProvStore进行可视化展示,并用SPARQL语言对起源信息进行查询,以分析不同视图的可视化结果。3)以“慢病与健康管理系统”为实验场景,选取典型的健康数据处理流程,通过实验,对健康数据处理可视化的起源模型进行分析,并通过不同的视图对场景的起源信息进行可视化展示,验证了本文设计方法的有效性。针对健康管理系统中数据处理存在的问题,本文基于数据起源PROV模型对健康数据的处理过程进行解释,并提出可视化方案,从而便于研究人员理解数据处理过程,为判断数据结果的可信性、可靠性提供依据。