论文部分内容阅读
基于大数据的远程健康监护技术是一种有效的健康监护服务技术。随着生活水平的不断提高,人们对远程健康监护服务的需求日益增加。然而,远程健康监护技术并不是十分完善。通过研究远程健康监护大数据质量优化控制方法,解决远程健康监护系统中的数据质量,从而实现健康状况的辅助决策,有效解决医疗资源分布不平均的问题。本文研究远程健康监护大数据质量优化控制方法研究,包括异常数据识别算法、缺失数据填充算法、重复数据检测算法。最后基于远程健康监护大数据对其进行仿真分析。具体工作如下:1.提出了远程健康监护大数据质量优化控制的总体方案。通过健康数据处理方案,对数据质量进行优化和控制,并提出异常数据识别、缺失数据填充和重复数据检测等需要解决的关键技术。2.提出了基于改进格拉布斯检验法的异常数据识别算法。通过分析格拉布斯检验法的不足和健康数据实际情况,在这个基本原则上提出了一种基于改进格拉布斯检验法的异常数据识别算法。仿真结果表明,该算法可以很好地解决健康数据值出现异常值的问题。3.提出了采用基于改进K-means算法和期望最大值法的缺失数据填充算法。通过基于人工鱼群算法对K-means算法进行优化,然后基于优化后的K-means算法进行缺失数据填充。仿真结果表明,优化后的K-means算法分类精度有所提高,基于优化K-means的缺失数据填充算法填充缺失数据的时间更短。4.提出了采用基于粒子群算法和近邻排序法的重复数据检测算法对重复的健康数据进行检测。通过将近邻排序法的参数作为一个整体参数进行编码,通过粒子群算法寻优之后,解码最优粒子群个体,得到近邻排序法的最优参数。仿真结果表明,优化后的近邻排序法检测精度有所提高,基于优化近邻排序法的重复数据检测算法检测重复数据的时间更短。