基于迁移学习的小样本心电图时序数据分类的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:w633744
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习模型在许多领域都取得了卓越成果,这其中的关键是大规模的有标注数据集。但实际上大规模数据集很难拥有完善的数据标注。那么如何利用小样本数据集来充分训练深度学习模型就显得尤为重要。其中,医学数据具有样本采集难、负样本少、样本标注少等问题,因此医学领域中大规模有标注的数据集非常稀缺。心电图利用心电图机从体表记录了心脏每一心动周期所产生的点活动变化图形,是医生诊断心脏病疾患的重要辅助手段和参考信息,但心电图诊断的门槛高,难以做到实时诊断,很难有效预防和及时治疗心脏病病变。目前,关于小样本心电图时序数据分类领域的研究较少,分类结果在精度和效率上面具有较大的提升空间。本文主要基于深度学习,根据心电图时序数据特点,提出了一种代价敏感的基于堆栈式降噪自编码器和双向长短期记忆神经网络的分类模型,有效提高了分类正确率和效率,并且解决了数据不平衡问题。同时又利用了迁移学习的思想,对模型进行了自适应改进,完成了小样本数据从源域到目标域的迁移。本文首先提出了可以解决不平衡心电图数据集的数据分类模型,在该模型中,堆栈式降噪自编码器作为编码器,可以自动地学习心电图数据中的语义编码特征,而不需要通过其它复杂方法来手动地提取特征。随后,双向长短期记忆神经网络分类器通过堆栈式降噪自编码器提取出的特征实现数据的分类。其中,堆栈式降噪自编码器不仅压缩了数据维度,还实现了降噪,而长短期神经记忆网络分类器则充分利用了时序数据中的时序信息。同时,该模型通过使用代价敏感损失函数来解决了不平衡数据集问题。该分类模型在MIT-BIH心率失常数据库、SVDB和NSTDB这三个数据库上进行了实验。最终实验结果证明该基础心电图时序分类模型不仅具有较高的准确性,还具有较高的分类效率。其次,分类模型融合了自适应批量标准化机制实现了小样本心电图时序数据分类,由于源域和目标域的数据分布不一致,直接迁移分类模型会使得分类效果不佳甚至出现负迁移。与其它的迁移学习方法相比,自适应批量标准化机制原理非常简单,它不需要复杂的计算,也不需要增加新参数,就能实现领域自适应。该改进模型在选定的UCR的心电图数据集上进行了实验,实验结果证明基于自适应批量标准化机制的改进模型能有效解决小样本心电图时序数据分类问题。
其他文献
我国是苹果产量大国,苹果产量占全球总产量的50%以上,苹果外观的好坏对苹果的售卖速度、价格与效益都有重要影响,因此,对苹果外观的快速、准确检测并分类是苹果售前处理的关
随着计算机技术的不断发展,药品安全管理一方面使药品生产销售的管理更为正规化,另一方面也为追溯药品来源及去向提供了可靠依据。由于药品安全管理系统信息录入过程中,包含
绩效考核作为提高企业和员工绩效的重要工具,在企业健康持续发展中的作用日趋重要,其重要性和必要性已被广泛接受,很多单位进行了积极探索,对于进一步增强企业的竞争力起到了
本文通过大量不同几何尺寸试样(不同面内/面外拘束)的J积分和裂尖张开位移(CTOD)的有限元数值计算,结合材料断裂韧性试验数据及理论分析的方法,主要研究基于CTOD的载荷无关的
模拟广播数字化是必然趋势。目前国内存在中国数字音频广播(Digital Audio Broadcast,DAB)和中国数字广播(China Digital Radio,CDR)两个行业标准,二者互有优劣,可能会长期共
Markov跳跃系统作为一类特殊的切换系统,由于能够很好地描述工业生产过程中各类复杂实际系统,受到了人们的越来越多的关注。此外,实际生活中的不确定性,外界干扰通常会对系统
准确的网络流量分类在网络安全领域中至关重要,有很多应用程序使用动态端口和加密算法来规避检测,而诸如基于端口和基于载荷的分类方式存在很大的不足。后续又出现了将机器学
胞外组蛋白(也称为循环组蛋白)是细胞在损伤、压力或死亡状态下释放的一种具有细胞毒性的物质,在脓毒症、类风湿性关节炎、急性肺损伤等多种疾病的发生发展中起关键作用。但
大规模城市风场研究在城市环境定量评估方面起着重要作用,有助于解决城市大气污染物扩散、行人风舒适度、城市热岛效应以及城市自然通风等问题,是城市微气候研究的热点问题之
异常检测旨在发现与大多数数据模式不匹配的实例。对于传统的时间序列异常检测算法而言,由于数据具有高维特性,在降维的过程中经常丢失一部分信息,造成检测错误。对于近年较