论文部分内容阅读
随着经济的发展和生活水平的提高,各种慢性病、亚健康人群也逐年攀升,人们逐渐意识到关注健康的重要性,但当前的医疗体系却越来越不能满足日益增长的健康管理需求。本课题依托实验室电子健康管理项目,对健康管理系统架构方案以及健康相关数据的分析与挖掘进行了广泛调研,确定了针对糖尿病患者连续血糖监控的数据挖掘方案,并针对现实应用中存在的问题对现有挖掘方法进行深入研究和针对性的改进。首先,本课题调研了主流的健康管理平台架设方案,对其中涉及到的硬件设备、无线传输等核心问题进行了广泛调研,对现有的一些系统进行了对比分析,为后续工程项目开发提供了一定的借鉴依据。另外课题还对数据挖掘在健康管理中的应用进行了调研,在文中以数据挖掘在糖尿病管理中的应用为例介绍了数据挖掘在健康管理中可能的应用。针对当前的技术条件和限制,确定了针对连续血糖监控的数据流转和分析方案:基本思想是将血糖数据的压缩和短期分析任务交由网关设备处理,压缩后的数据传输到服务器端进行长期的存储和分析。针对连续血糖监控特定的数据压缩和分析需求,本课题调研了时间序列挖掘领域的最新研究进展,充分对比了现有的时间序列压缩技术,并最终选定了分段线性逼近的数据压缩方法,提出并设计了基于分段线性逼近的动态时间规整方法TDTW(Trended Dynamic Time Warping)。经实验验证,TDTW不仅能够满足项目处理数据的应用需求,而且具有一定的通用价值,在某些数据集上能够改善距离度量效果。课题针对TDTW在实际应用中匹配后的序列轮廓显著改变的问题,提出了施加惩罚因子的处理方法:根据匹配过程中线段的延伸的程度和斜率变化情况计算得到一个轮廓变化的量化指标,修正最终的距离度量结果。针对TDTW执行速度较慢的情况,课题提出了施加延伸倍数约束的优化方案,虽然在本质上没有降低算法复杂度,但对于数目较少的序列显著加快了计算速度,具有一定的实际意义。最后对文章主体内容进行了总结,并对后续项目进展和相关学术研究进行展望。