论文部分内容阅读
心律失常是由心脏电传导系统异常导致的心律不规则疾病。多数心律失常患者发病轻时没有症状,但随病情发展可能会从出现心悸和心跳停顿等症状发展到中风或心力衰竭等并发症。目前,常通过心电图(Electrocardiogram,ECG)来诊断心律失常。基于机器学习开展心律失常识别,可对ECG信号数据进行自动分析,识别出其中可反映不同类型心律失常的模式,从而实现对心律失常的检测和预测。因其具有高效性和可用于长期动态心电监护等优势,有利于心律失常疾病的及早诊断和及时预警,可为患者的治疗赢得宝贵时间,得到了越来越多的关注。现阶段关于心律失常识别方法的研究,主要有分步进行的(step-by-step)机器学习方法和深度学习的方法。分步进行的机器学习方法从已有的经验知识出发,人工提取ECG数据特征并用分类器进行分类。该类方法在受试者的ECG模式特征稳定,个体间差异性较小的情况下,可以获得较好的识别效果。但具有容易受噪声影响和模型泛化能力不稳定等问题。深度学习方法可自动提取ECG数据中的深层次非线性特征,对噪声具有较强的鲁棒性。但现有公开的心律失常类数据集规模较小,使得模型容易陷入过拟合;且深度神经网络模型存在可解释性弱的问题,影响其在临床决策支持中的应用。针对上述存在的问题,本文结合分步骤进行的机器学习与深度学习的方法,研究如何在数据集规模较小,样本的分类严重不平衡且个体差异大的背景下,提高模型的心律失常的识别性能。论文主要的研究内容和成果如下:一、针对因患者特异性导致的模型在不同患者间的ECG信号分类性能不稳定,模型泛化能力弱的问题。本文提出一种基于多核学习核极限学习机的随机森林(MKELMRF)分类模型,用以对心拍进行分类。该方法首先基于多核学习构建多核学习的核极限学习机,多核映射的组合特征空间可形成对不同心拍类型的更好的特征表达。然后以多核学习核极限学习机作为基分类器,构建随机森林二分类模型,样本和属性的随机选择可增强模型对不同个体ECG信号识别的泛化性能。最后,通过一对一集成方法以及类别概率策略把多个二分类器集成起来,得到多类别分类模型,以提高多分类结果的稳定性。在跨患者评估模式下,模型在公开的数据集上的分类准确率和kappa值分别达到98.1%和90.9%。对两类重要的异常心拍,室上性异位心拍和室性异位心拍识别的灵敏度分别达到100%和94.4%,实验结果优于对比的同类研究工作。二、针对采用深度学习的方法对心拍进行自动分类问题中,存在的数据集规模小导致模型泛化能力不佳,以及样本分类不平衡造成的模型对异常心拍分类结果不理想的问题,提出一种基于数据增强迁移学习的自动心拍分类方法。首先,该方法通过生成式对抗网络生成样本量较小的异常心拍类别的模拟数据,以构造平衡数据集。其次,该方法基于深层次的、在大规模数据集上训练得到的卷积神经网络VGGNet构造迁移学习网络,对特征提取层进行选择,以便更好地自动提取复杂特征。与其他研究工作相比,本文方法不需要对数据进行去噪声预处理,且可以得到更准确地心拍分类结果。三、针对现有阵发性房颤预测研究中,存在的需要在长时间间隔ECG信号上进行分析不适用于实时阵发性房颤预测,以及长期ECG监护中流式高采样频率数据带来大的存储和计算压力问题,本文提出一种基于概率符号化模式识别和CNN-LSTM的阵发性房颤实时预测模型。该方法首先使用概率符号化模式识别方法,在降采样至8Hz的ECG序列上提取模式转移特征,降低模型的计算量和对存储空间的需求,确保实时预测的效果。其次,基于CNN与LSTM的混合模型CNN-LSTM提取模式转移特征内隐含的局部空间特征和时间依赖特征。最后,采用Spark Streaming技术完成对ECG流式数据的读、写和计算,实现了数据和模型之间的低延迟通信。所提的模型在公开数据集上的准确率、灵敏度和特异度分别为91.26%、82.21%和95.79%。模型处理总延迟平均2秒,满足实时阵发性房颤预测需求。四、针对在房颤检测研究中,存在的对发作时期较短的房颤片段识别灵敏度较低的问题,本文提出一种基于时空注意力机制的房颤检测模型。该方法首先使用卷积神经网络对短时间窗口ECG信号进行局部空间特征提取并进行向量变换得到可反映ECG各部分波形的特征向量。然后采用Sequence-to-Sequecne模型中的编码器对由空间注意力权重加权的短时间窗口进行编码,得到可反映时间窗口内各部分波形的重要程度的中间编码向量。随后解码器对中间变量进行解码时利用时间注意力机制对各时间窗口加权得到的带有时间注意力权重的编码向量作为输入,得到逐时间窗口的分类输出。该方法可在短时间ECG片段上进行检测的同时利用长时间序列的信息,可获得ECG信号空间部分和时间片段对分类的贡献度,在提高模型房颤检测效果的同时更好地支持临床决策。在公开的房颤检测数据集上的实验结果,验证了该方法的有效性。