论文部分内容阅读
心电信号(Electrocardiogram,ECG)是心脏生物电活动的记录,是一种非平稳、非线性、随机性强的弱生理信号。以深度学习技术为代表的ECG分类算法对心血管疾病(Cardiovascular disease,CVD)的临床诊断具有重要意义。已有针对特定CVD分类任务而设计的深度学习模型,直接应用于新的CVD分类任务中效果不佳,重新训练适用于新CVD分类任务的深度学习模型,不仅需要大量有标注的ECG样本,而且需要大量的计算资源和时间。利用数据之间的共同特征、重用已有的分类模型是应对ECG标签样本不足,提高分类准确率的技术途径。本课题以深度学习为技术基础,以迁移学习为切入点,探索对提高ECG分类识别率的方法。ECG分类领域内数据量有限,首先以图片域为源域,重用图片分类领域的大型预训练网络,通过微调预训练模型,实现ECG分类;进而结合ECG的时序特性,构建心电预训练分类模型,并使用标注数据对其进行重用,实现目标分类任务;最后在无法使用标注数据进行ECG模型重用时,通过基于最大均值差异的域适应方法,减少源域和目标域特征分布的差异,实现ECG分类的域适应。主要研究工作包括:(1)针对ECG公开数据集中样本量有限的现状,以大型图片数据集中的预训练模型进行模型适配,实现ECG分类。首先,使用连续小波变换(Continuous Wavelet Transform,CWT)将原始的一维ECG转换为小波尺度图,并适配预训练网络输入尺寸,微调经过Image Net训练的Alex Net、Goog Le Net和Squeeze Net的网络结构,并把网络修改为三分类的输出。在心律不齐、窦性心律和心力衰竭的数据集上进行三分类实验,模型准确率分别达到93.75%,90.63%和96.88%。(2)为实现ECG分类领域中的模型迁移,基于双向门控循环单元(Bidirectional Gate Recurrent Unit,Bi GRU)进行微调适配。首先将ECG进行去噪和基线漂移处理,使用源数据建立预训练模型,采用预训练模型的权重初始化目标域模型;然后设计并选取不同数量的训练样本建立模型训练集,选择标签空间为:‘不同’和‘相同’,两组数据集作为测试集进行模型验证。在MIT-BIH心律不齐数据集和PTB心肌梗塞数据集上进行单向迁移实验,模型准确率达到95.87%,相较于未使用适配方法提高了3.56%。在中国心血管疾病数据库(Chinese Cardiovascular Disease Database,CCDD)中的房颤数据和MIT-BIH心房颤动数据集(AFDB)上进行双向迁移实验,模型准确率分别达到98.30%和89.19%,相较于未使用适配方法分别提高了0.13%和0.94%。(3)针对ECG的无监督域适应问题,构建基于最大均值差异(Maximum Mean Discrepancy,MMD)的域适应网络模型MMD-Bi GRU-Net。首先将源域和目标域映射至再生希尔伯特空间(Reproducing Kernel Hilbert Space,RKHS),然后通过最小化MMD度量之间的距离,并利用源域的标签信息使模型学习对公共空间的分类,从而达到分类目标域的目的。在CCDD和AFDB上进行双向无监督域适应实验,平均准确率分别达到73.34%和70.74%,相较于未进行域适应,分别提高11.70%和17.74%。