论文部分内容阅读
随着社会经济的快速发展和人口的迅速老龄化,心血管患病率居高不下,与此同时医疗技术迅速发展形成的现代医疗器械可以实现对病人全方位的实时检查,由此不可避免的产生了海量的监测数据,海量医疗数据的处理是未来医疗发展中面临的现实问题,而基于深度学习的数据挖掘技术是解决该问题的有效手段之一。然而,如何从海量数据中挖掘知识,并将其应用于医疗疾病诊断实际中,同时,在保证诊断准确性的基础上,提高数据处理速度就是需要重点研究的内容。本文从特征自动提取和智能诊断分类技术两个方面入手,针对传统特征提取方法依赖于人工经验的缺陷,利用无监督学习方法自动提取数据中的知识,并通过参数自适应的遗传编程方法优化特征,在此基础上,研究Softmax回归模型,利用其结构简单的优点实现快速有效的故障分类。具体研究内容如下:(1)针对在现有经验知识基础上如何提高特征提取效果的问题,研究基于遗传编程的特征提取方法,并针对遗传编程算法中关键参数的初始值选取问题,提出关键参数自适应调整的遗传编程算法,避免参数初始值对优化结果的影响,并提高遗传编程算法寻优效率,最后通过符号回归实验验证所提方法的有效性。(2)针对特征提取过程中缺乏信号先验知识的问题,提出基于自编码神经网络的无监督特征提取方法,利用网络隐藏单元数少的特性,通过将数据转特征再还原这一过程,实现数据中隐含知识的提取,同时,结合实验验证所提出的快速确定网络隐层单元数方法的有效性。(3)针对医疗疾病诊断中缺乏快速、有效的故障分类方法的问题,提出基于Softmax回归模型的分类方法,模型简单的结构避免繁琐的参数训练过程,同时,以最大化样本数据被正确分类的概率为学习目标使得模型能够更加专注于数据的类别信息,减少无关特征信息的干扰,提高分类结果的准确性。最后通过实验验证该方法的分类性能。(4)将上述方法应用于医疗心脏病诊断,利用自适应遗传编程方法对病人心电图数据进行特征提取,同时,利用病人心电图数据构建10000组样本数据以训练自编码神经网络,模拟其处理海量数据的情形,并利用自编码神经网络提取振动数据特征,将提取的特征输入到Softmax回归模型中进行训练和诊断,以验证方法的有效性。