用于小样本人体传感数据机器学习的神经网络表征与拓扑印记分析机理研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 1次 | 上传用户:titaige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体传感数据的分析与识别是人的健康状态辨识及临床状态监测的重要手段,是健康信息学和生物医学工程领域一个重要的研究方向。人体传感数据来源于传感器对人体生命活动中各种信号的获取,人体的复杂非线性动力学特性以及采集过程中不可避免的外部环境干扰,使得人体传感数据具有非线性和非平稳的特点。近年来,在人体传感数据分析方面已经有了的大量的基于特征参量的模式分析方法,然而这些静态特征参量对非线性和非平稳性数据的表征能力是有局限的。基于神经网络表征学习的方法由于其非线性结构和自主学习能力,使得其在具有大量非标数据的人体传感数据分析场景中具有重要的应用价值。此外,对非线性和非平稳性人体传感数据的相空间重建,通过分析其系统特性的拓扑印记描述,可以有效的刻画人体活动过程中的动态特性,从而实现有限样本下的人体状态模式识别。同时,人体生命活动过程的异常态往往具有偶发性,使得人体传感数据中的负样本个数是较少数的。例如,心律失常分析中异常心搏的比例远小于正常心搏,帕金森疾病受试者行走实验中冻结步态异常出现频率远小于正常步态。负类样本如异常心搏、冻结步态属于偶发事件,在数据集整体而言,其相对于正类样本必定是小样本的。再者,从有限规模的受试者采集多样本数据,存在着高临床风险、不可控的重复性以及高成本等问题。这些因素决定了人体传感数据分析问题往往是基于小样本数据集评价的。人体传感数据分析问题是典型的小样本学习问题。一般地,当数据集的某些样本较少时,可以采用基于先验知识的方法来实现小样本集的数据扩充,从而得到足够大的数据样本来实现学习模型的训练。如图像处理及模式识别中采用旋转、翻转、裁剪原数据来生成新数据样本的数据增强方法。然而,在小样本人体传感数据学习中,人体状态的复杂性和随机性对应的数据分布是未知的,无法通过基于先验知识提取的方法来获得可靠的数据样本来实现数据增强。其他的小样本学习数据集扩充包括从相似数据集或无监督数据集进行转化等,在人体传感数据分析特别是某些病理模式分析中,往往具有极高的成本,甚至是不可行的。近年来,采用基于模型的方法为小样本数据学习提供了新的思路。本文围绕基于模型的小样本学习问题在人体传感数据分析中的科学问题及实际应用,结合工程实践需求,研究了具有大非标数据情况下的预训练-再优化策略的神经网络表征提取小样本学习模型,提出了一种有限数据情况下的基于拓扑印记分析的小样本学习模型。本文从人体传感数据分析中的有效特征提取和小样本学习两个方面出发,结合课题组承担的科技项目和实际工程实践需求,以心电信号和步态信息两种典型的人体传感数据为研究对象,研究了基于神经网络表征和拓扑印记分析的特征提取应用和小样本学习机理,设计了相关的计算框架和分类算法并进行了验证。本文的主要工作内容包括以下四个方面:1.研究了在具有大量无监督数据中的小样本学习问题,提出了基于深度自编码网络的预训练-参数再优化的小样本学习策略,以人体心电传感数据为研究对象,详细介绍了深度自编码网络的预训练方法、分类系统构建及参数优化、神经网络表征的提取方法,最后对模型的心律失常分类和辨识能力进行了实验验证。实验结果表明,基于深度自编码神经网络表征的学习方法能有效利用无监督数据来提升小样本心电学习问题的建模能力和识别精度。2.研究了基于深度置信神经网络表征的预训练-参数再优化的小样本学习策略在心电复杂模式分析中的应用,提出了一种多导联合决策优化方法。介绍了基于受限玻尔兹曼机的深度置信网的预训练方法、分类系统构建和参数优化方法,提出了一种组合优化联合决策算法来提升模型的心电复杂模式分析能力。实验结果证实深度置信神经网络的复杂心电模式的表征能力,提出的联合决策优化方法是一种有效的信息融合策略。3.提出了一种基于拓扑印记分析的小样本嵌入学习机制,基于非线性动态分析的延时嵌入方法构建位于相空间的人体传感数据点云,提出了一种基于二维点云拓扑建模来获取拓扑印记特征进而应用到小样本学习任务中的分析框架和分类系统,包括人体传感数据的相空间重建、点云数据的拓扑建模、拓扑印记的提取及随机森林分类。在有限样本的心电小样本学习任务中,取得了良好的分类精度,表现出了较好的心电建模能力。4.研究了人体步态间隔序列的拓扑建模方法,探讨了基于拓扑印记的小样本嵌入学习在神经退行性疾病辨识的应用。研究了不同类型神经退行性疾病(肌硬化症、亨廷顿疾病、帕金森症)的拓扑印记特征及其分类辨识应用,构建人体步态数据分析的小样本分类系统。实验结果表明,拓扑印记在小样本步态间隔数据学习中具有显著的表征能力和良好的分类性能。综上所述,本文研究了基于神经网络表征的人体心电数据分析方法及应用,提出的深度自编码网络结构分类系统和深度置信网决策系统已经应用到可穿戴随身监护系统的数据分析平台中,取得了良好的应用和实践价值。本文提出的基于拓扑印记分析的模式提取方法,在神经退行性疾病等病理分析问题中取得了良好的结果,具有较大的临床价值。本文的工作进一步拓展了健康信息学的理论体系,将神经网络表征分析和拓扑印记分析的相关研究内容与健康信息学的实践需求结合起来,引入的小样本学习机制,具有重要的理论价值。
其他文献
近日,河北省住房城乡建设厅联合7部门印发《河北省绿色建筑创建行动实施方案》(以下简称《方案》)。《方案》明确了创建行动的工作目标,2022年,全省城镇新建建筑中绿色建筑面
随着国家扶贫事业的快速发展和精准扶贫政策的推行,脱贫攻坚工作取得了很大的进展。但是当前还有大学生因贫困休学辍学的情况存在,高校资助育人工作仍面临着较大的压力。虽然
文化是一个国家、一个民族的灵魂,社会主义文化建设是中华民族伟大复兴重要的一环。红色文化作为中国特色社会主义文化的重要组成部分,其传承与创新是社会主义文化建设的必然要
报纸
随着我国当代城市建设标准的提高和土地利用价值的增高,高层民用住宅小区建设呈现El益发展的趋势,各种电气设备的使用日益增多,导致用电量大幅度上升,与城市现有供电资源的匮乏形
为了提高视频目标检测的边缘准确性,提出一种基于卷积神经网络和马尔可夫随机场的视频目标检测算法。通过视频的置信帧来调节与优化神经网络,解决深度卷积神经网络的标签不一致问题;采用马尔可夫模型将前景目标与背景分割,对超像素做平滑处理;设计前后光流融合的密集光流法,提高目标的运动一致性。基于多组公开视频数据集进行了仿真实验,结果显示该算法在目标检测性能方面具有明显的优势,提取的目标轮廓具有较高的准确性。
随着我国高等教育的快速发展,学生户籍档案管理已不适应社会变革发展的需要,现行高校学生户口迁移管理制度也暴露出不少问题,如何改革高校学生户籍档案,已成为我国户籍管理工
安多弹唱艺术是藏族民歌、民间器乐以及当代音乐、外来乐器相结合而产生的一种艺术形式,最初由对藏族传统音乐的继承和个体行为发展为目前以安多牧区为主要传播地兼及各个藏
房地产业的发展对整个地区经济的发展有明显的促进作用,本地经济的发展又推动房地产业的发展。为了两者的协同发展,本文简单介绍我县房地产业的发展现状,分析了房地产业与区域经
聚合物微球由于高比表面积、高吸附能力、尺寸可控及易功能化等优点而被广泛应用于生物医药、电子信息、能源环境和胶体组装等领域。历经一百多年的发展,目前已经建立了从10
本论文梳理了高铁开通吸引人才的机理。高铁开通极大地缩短了时间以及空间上的距离,具有时空压缩效应,使得市场规模扩大且直接刺激就业;高铁开通提升了生产要素流动的频次和速率,降低了运输成本,同时指引资本、劳动力、技术、信息等要素向着高速铁路沿线城市汇聚,加快沿线城市经济发展步伐。此外,高铁开通加强企业总部和分支机构的交流合作,提升企业内部的经营管理效率,使得管理职能专业化。在综上所述高铁开通的作用下,高