基于机器学习的心律失常识别问题关键技术的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wistaria
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
心律失常是由心脏电传导系统异常导致的心律不规则疾病。多数心律失常患者发病轻时没有症状,但随病情发展可能会从出现心悸和心跳停顿等症状发展到中风或心力衰竭等并发症。目前,常通过心电图(Electrocardiogram,ECG)来诊断心律失常。基于机器学习开展心律失常识别,可对ECG信号数据进行自动分析,识别出其中可反映不同类型心律失常的模式,从而实现对心律失常的检测和预测。因其具有高效性和可用于长期动态心电监护等优势,有利于心律失常疾病的及早诊断和及时预警,可为患者的治疗赢得宝贵时间,得到了越来越多的关注。现阶段关于心律失常识别方法的研究,主要有分步进行的(step-by-step)机器学习方法和深度学习的方法。分步进行的机器学习方法从已有的经验知识出发,人工提取ECG数据特征并用分类器进行分类。该类方法在受试者的ECG模式特征稳定,个体间差异性较小的情况下,可以获得较好的识别效果。但具有容易受噪声影响和模型泛化能力不稳定等问题。深度学习方法可自动提取ECG数据中的深层次非线性特征,对噪声具有较强的鲁棒性。但现有公开的心律失常类数据集规模较小,使得模型容易陷入过拟合;且深度神经网络模型存在可解释性弱的问题,影响其在临床决策支持中的应用。针对上述存在的问题,本文结合分步骤进行的机器学习与深度学习的方法,研究如何在数据集规模较小,样本的分类严重不平衡且个体差异大的背景下,提高模型的心律失常的识别性能。论文主要的研究内容和成果如下:一、针对因患者特异性导致的模型在不同患者间的ECG信号分类性能不稳定,模型泛化能力弱的问题。本文提出一种基于多核学习核极限学习机的随机森林(MKELMRF)分类模型,用以对心拍进行分类。该方法首先基于多核学习构建多核学习的核极限学习机,多核映射的组合特征空间可形成对不同心拍类型的更好的特征表达。然后以多核学习核极限学习机作为基分类器,构建随机森林二分类模型,样本和属性的随机选择可增强模型对不同个体ECG信号识别的泛化性能。最后,通过一对一集成方法以及类别概率策略把多个二分类器集成起来,得到多类别分类模型,以提高多分类结果的稳定性。在跨患者评估模式下,模型在公开的数据集上的分类准确率和kappa值分别达到98.1%和90.9%。对两类重要的异常心拍,室上性异位心拍和室性异位心拍识别的灵敏度分别达到100%和94.4%,实验结果优于对比的同类研究工作。二、针对采用深度学习的方法对心拍进行自动分类问题中,存在的数据集规模小导致模型泛化能力不佳,以及样本分类不平衡造成的模型对异常心拍分类结果不理想的问题,提出一种基于数据增强迁移学习的自动心拍分类方法。首先,该方法通过生成式对抗网络生成样本量较小的异常心拍类别的模拟数据,以构造平衡数据集。其次,该方法基于深层次的、在大规模数据集上训练得到的卷积神经网络VGGNet构造迁移学习网络,对特征提取层进行选择,以便更好地自动提取复杂特征。与其他研究工作相比,本文方法不需要对数据进行去噪声预处理,且可以得到更准确地心拍分类结果。三、针对现有阵发性房颤预测研究中,存在的需要在长时间间隔ECG信号上进行分析不适用于实时阵发性房颤预测,以及长期ECG监护中流式高采样频率数据带来大的存储和计算压力问题,本文提出一种基于概率符号化模式识别和CNN-LSTM的阵发性房颤实时预测模型。该方法首先使用概率符号化模式识别方法,在降采样至8Hz的ECG序列上提取模式转移特征,降低模型的计算量和对存储空间的需求,确保实时预测的效果。其次,基于CNN与LSTM的混合模型CNN-LSTM提取模式转移特征内隐含的局部空间特征和时间依赖特征。最后,采用Spark Streaming技术完成对ECG流式数据的读、写和计算,实现了数据和模型之间的低延迟通信。所提的模型在公开数据集上的准确率、灵敏度和特异度分别为91.26%、82.21%和95.79%。模型处理总延迟平均2秒,满足实时阵发性房颤预测需求。四、针对在房颤检测研究中,存在的对发作时期较短的房颤片段识别灵敏度较低的问题,本文提出一种基于时空注意力机制的房颤检测模型。该方法首先使用卷积神经网络对短时间窗口ECG信号进行局部空间特征提取并进行向量变换得到可反映ECG各部分波形的特征向量。然后采用Sequence-to-Sequecne模型中的编码器对由空间注意力权重加权的短时间窗口进行编码,得到可反映时间窗口内各部分波形的重要程度的中间编码向量。随后解码器对中间变量进行解码时利用时间注意力机制对各时间窗口加权得到的带有时间注意力权重的编码向量作为输入,得到逐时间窗口的分类输出。该方法可在短时间ECG片段上进行检测的同时利用长时间序列的信息,可获得ECG信号空间部分和时间片段对分类的贡献度,在提高模型房颤检测效果的同时更好地支持临床决策。在公开的房颤检测数据集上的实验结果,验证了该方法的有效性。
其他文献
水稻是世界上最主要的粮食作物,一半以上的世界人口以水稻为食,中国是水稻总产量最多的国家。黑龙江省是中国水稻生产大省之一,是中国北方生产面积最大的省,是中国商品稻谷生
相变材料Ge2Sb2Te5(GST)是大密度光相变存储技术的重要材料之一,几十年来其晶态-非晶态之间的超快转化过程受到了广泛的关注和研究。但目前研究多集中于其相变初态和终态,而对
在经济全球化的不可逆形势下,企业竞争成为了永恒不变的话题。技术人员是支持企业战略发展与转型的核心力量,身处环境复杂,且不断变化的宏观背景下,对薪酬的需求在不断地增强,因此,企业必须努力了解,且不断地满足不同员工的需要,企业如何优化现行的薪酬体系必然成为企业生存乃至发展的重要因素。而且,在企业现行的人力资源体系下,科学、有效且合理的薪酬管理体系对于人才的留住、选拔、激励和发展等方面具有最有力、最关键
空气源热泵作为一种高效节能的可再生能源技术,在我国不同地域得到了广泛应用,具有广阔的发展前景。空气源热泵在冬季的制热运行中经常面临结霜问题,当其室外换热器表面温度
本研究试图考察面孔和声音之间是否存在某种有迹可循的内在联系,以及人们是否具有跨通道匹配陌生面孔-声音身份信息的能力。采用眼动技术和脑电技术进行实验验证,共实施两个
本课题通过对北里链霉菌(Streptomyces kitasatoensis)代谢进行调控,在促进吉他霉素合成的同时,优化其组分。在研究摇瓶中添加甘油对吉他霉素合成影响时,发现豆油为4%,甘油为
利用流动沸腾换热的微通道热沉具有所需工质流量小、换热系数高、温度分布均匀等优势,是适用于高热流密度微电子器件的一种极具应用前景的散热技术。但随着热流密度不断攀升,
随着计算机技术的不断发展,图像分割作为图像处理的关键技术,在模式识别、目标跟踪和图像理解等领域具有重要意义。国内外一些学者致力于图像分割问题的研究并提出了许多分割
1,8-萘酰亚胺类比率荧光探针分子是基于分子内电荷转移的金属离子探针,改变识别基团的结构可以获得高选择性的Cu(II)和Cd(II)离子荧光探针,荧光发射波长蓝移。本文应用密度泛函理
水污染问题是现代社会关注的主要环境问题之一。大量污水来自于工业生产和家庭生活,它们携带着各种化学物质如果未经处理被排入湖泊、河流和海洋后则会严重影响水质。其中,含