论文部分内容阅读
人体传感数据的分析与识别是人的健康状态辨识及临床状态监测的重要手段,是健康信息学和生物医学工程领域一个重要的研究方向。人体传感数据来源于传感器对人体生命活动中各种信号的获取,人体的复杂非线性动力学特性以及采集过程中不可避免的外部环境干扰,使得人体传感数据具有非线性和非平稳的特点。近年来,在人体传感数据分析方面已经有了的大量的基于特征参量的模式分析方法,然而这些静态特征参量对非线性和非平稳性数据的表征能力是有局限的。基于神经网络表征学习的方法由于其非线性结构和自主学习能力,使得其在具有大量非标数据的人体传感数据分析场景中具有重要的应用价值。此外,对非线性和非平稳性人体传感数据的相空间重建,通过分析其系统特性的拓扑印记描述,可以有效的刻画人体活动过程中的动态特性,从而实现有限样本下的人体状态模式识别。同时,人体生命活动过程的异常态往往具有偶发性,使得人体传感数据中的负样本个数是较少数的。例如,心律失常分析中异常心搏的比例远小于正常心搏,帕金森疾病受试者行走实验中冻结步态异常出现频率远小于正常步态。负类样本如异常心搏、冻结步态属于偶发事件,在数据集整体而言,其相对于正类样本必定是小样本的。再者,从有限规模的受试者采集多样本数据,存在着高临床风险、不可控的重复性以及高成本等问题。这些因素决定了人体传感数据分析问题往往是基于小样本数据集评价的。人体传感数据分析问题是典型的小样本学习问题。一般地,当数据集的某些样本较少时,可以采用基于先验知识的方法来实现小样本集的数据扩充,从而得到足够大的数据样本来实现学习模型的训练。如图像处理及模式识别中采用旋转、翻转、裁剪原数据来生成新数据样本的数据增强方法。然而,在小样本人体传感数据学习中,人体状态的复杂性和随机性对应的数据分布是未知的,无法通过基于先验知识提取的方法来获得可靠的数据样本来实现数据增强。其他的小样本学习数据集扩充包括从相似数据集或无监督数据集进行转化等,在人体传感数据分析特别是某些病理模式分析中,往往具有极高的成本,甚至是不可行的。近年来,采用基于模型的方法为小样本数据学习提供了新的思路。本文围绕基于模型的小样本学习问题在人体传感数据分析中的科学问题及实际应用,结合工程实践需求,研究了具有大非标数据情况下的预训练-再优化策略的神经网络表征提取小样本学习模型,提出了一种有限数据情况下的基于拓扑印记分析的小样本学习模型。本文从人体传感数据分析中的有效特征提取和小样本学习两个方面出发,结合课题组承担的科技项目和实际工程实践需求,以心电信号和步态信息两种典型的人体传感数据为研究对象,研究了基于神经网络表征和拓扑印记分析的特征提取应用和小样本学习机理,设计了相关的计算框架和分类算法并进行了验证。本文的主要工作内容包括以下四个方面:1.研究了在具有大量无监督数据中的小样本学习问题,提出了基于深度自编码网络的预训练-参数再优化的小样本学习策略,以人体心电传感数据为研究对象,详细介绍了深度自编码网络的预训练方法、分类系统构建及参数优化、神经网络表征的提取方法,最后对模型的心律失常分类和辨识能力进行了实验验证。实验结果表明,基于深度自编码神经网络表征的学习方法能有效利用无监督数据来提升小样本心电学习问题的建模能力和识别精度。2.研究了基于深度置信神经网络表征的预训练-参数再优化的小样本学习策略在心电复杂模式分析中的应用,提出了一种多导联合决策优化方法。介绍了基于受限玻尔兹曼机的深度置信网的预训练方法、分类系统构建和参数优化方法,提出了一种组合优化联合决策算法来提升模型的心电复杂模式分析能力。实验结果证实深度置信神经网络的复杂心电模式的表征能力,提出的联合决策优化方法是一种有效的信息融合策略。3.提出了一种基于拓扑印记分析的小样本嵌入学习机制,基于非线性动态分析的延时嵌入方法构建位于相空间的人体传感数据点云,提出了一种基于二维点云拓扑建模来获取拓扑印记特征进而应用到小样本学习任务中的分析框架和分类系统,包括人体传感数据的相空间重建、点云数据的拓扑建模、拓扑印记的提取及随机森林分类。在有限样本的心电小样本学习任务中,取得了良好的分类精度,表现出了较好的心电建模能力。4.研究了人体步态间隔序列的拓扑建模方法,探讨了基于拓扑印记的小样本嵌入学习在神经退行性疾病辨识的应用。研究了不同类型神经退行性疾病(肌硬化症、亨廷顿疾病、帕金森症)的拓扑印记特征及其分类辨识应用,构建人体步态数据分析的小样本分类系统。实验结果表明,拓扑印记在小样本步态间隔数据学习中具有显著的表征能力和良好的分类性能。综上所述,本文研究了基于神经网络表征的人体心电数据分析方法及应用,提出的深度自编码网络结构分类系统和深度置信网决策系统已经应用到可穿戴随身监护系统的数据分析平台中,取得了良好的应用和实践价值。本文提出的基于拓扑印记分析的模式提取方法,在神经退行性疾病等病理分析问题中取得了良好的结果,具有较大的临床价值。本文的工作进一步拓展了健康信息学的理论体系,将神经网络表征分析和拓扑印记分析的相关研究内容与健康信息学的实践需求结合起来,引入的小样本学习机制,具有重要的理论价值。