论文部分内容阅读
世界卫生组织披露全球三成死亡归咎于心血管疾病,能够高效快速的诊断心血管疾病有着极为重要的现实意义。心电图(Electrocardiogram,ECG)是心脏生理活动信号的一种图形化展示,能够辅助医生诊断心脏疾病。传统的心电自动识别系统是通过提取波形的特征,再利用成熟的机器学习算法分类。这种方法有两大问题:一是要求开发人员有较强的医学知识素养;二是需要大量数据去训练获得模型,模型还需要定期维护。本课题期望在没有医学知识背景的情况下,利用相似性度量方法在数据库中查找最相似的k条序列,再利用KNN分类器判定查询序列类别。然而,由ECG序列的复杂性与高维性,致使现有的方法不能快速有效的度量其相似性。本课题围绕ECG序列的表示与相似性度量这两个方面展开研究,分别提出了重要点的趋势偏转距离的分段线性表示方法(IPDT_PLR)与基于DTW的分段模式距离相似性度量算法(Seg Mode_DTW)。IPDT_PLR方法是基于ITTP_PLR方法的,它继承了ITTP_PLR方法能保留重要趋势转折点的优点,同时对ITTP_PLR方法存在的问题有针对的改进。IPDT_PLR方法通过加入拐点信息克服了ITTP_PLR方法对于单调趋势序列拟合效果差的缺点。通过自顶向下的挑选重要点的方式能更好的挑选出序列中的重要点。通过修改分段的标准能进一步降低拟合误差。在相似性度量的研究中,本课题提出的Seg Mode_DTW算法从三个方面对原有的DTW算法进行改进。第一是主要子模式匹配,通过主要子模式匹配,减少检索范围,从而加快相似性度量;第二是在DTW框架下引入了线段模式距离的概念,有效克服了DTW方法没考虑样本点的趋势的缺点;第三是基于DTW方法提出了分段模式距离(Seg Mode_DTW)算法,它保证了两个强特征点的对齐,使每一分段的趋势也更加明确,有效减少了DTW的错误匹配。同时也加快了度量速度。实验表明Seg Mode_DTW算法能广泛地、高效地、准确地适用于ECG时间序列数据集的相似性查询。