【摘 要】
:
呼吸音在肺部疾病的预防和诊断中起着至关重要的作用。针对呼吸音进行听诊是筛查和诊断肺部疾病的主要方式之一。然而传统的听诊需要专业的医生来进行,在医疗资源日益紧缺的社会中,更加需要一种自动诊断系统来帮助人们缓解医疗资源不足的压力。深度神经网络在解决这类问题上具有很大的潜力,然而,训练一个有效果的深度神经网络需要大量的数据作为基础,最大的呼吸数据集ICBHI只有900多条呼吸音音频,这对于训练一个深度神
论文部分内容阅读
呼吸音在肺部疾病的预防和诊断中起着至关重要的作用。针对呼吸音进行听诊是筛查和诊断肺部疾病的主要方式之一。然而传统的听诊需要专业的医生来进行,在医疗资源日益紧缺的社会中,更加需要一种自动诊断系统来帮助人们缓解医疗资源不足的压力。深度神经网络在解决这类问题上具有很大的潜力,然而,训练一个有效果的深度神经网络需要大量的数据作为基础,最大的呼吸数据集ICBHI只有900多条呼吸音音频,这对于训练一个深度神经网络模型来说仍然是很少的。另一方面,对于传统的卷积神经网络,模型往往不能很好地利用呼吸音的时间特征。为了解决这一问题,在迁移学习的基础上,本文新提出了一个解决方案,利用在Audioset上训练的VGGish模型以及一套新颖的技术,本文主要内容包括:(1)本文改良了呼吸音特征提取与特征优化过程,将音频进行去噪后采用Mel谱图对呼吸音进行图像化处理;呼吸音信号经高通滤波去除低频噪声,而滤波后仍然存在一定的心音噪音,本文利用小波阈值方法分解目标信号,不直接提取呼吸音,先将呼吸音视为噪音,再通过重构心音,并与原始信号相减获得纯净的呼吸音信号。并基于Grad Cam进行特征优化,本文有选择地从谱图的高频区域剪掉一部分进行特征优化,以确保网络聚焦于感兴趣的区域。(2)为了充分利用呼吸音的时间特征,本文融合CNN-RNN网络提出一个新的模型。该模型算法基于VGGish和Bi LSTM两种网络,并将卷积网络部分与循环网络部分相结合,之后利用呼吸音数据对Bi LSTM网络进行再训练,提取呼吸音的时间特征。另外本文为了更好的融合VGGish与Bi LSTM的输出,弥补Bi LSTM网络在训练过程中损失的特征信息,本文采用Time Pooling层将VGGish和Bi LSTM的输出进行处理,最后通过全连接拼合VGGish与Bi LSTM输出的向量进行训练,提高模型泛化能力。(3)为了解决样本量不足的情况,本文利用迁移学习,将VGGish在Audioset上预训练获得相似领域知识后再通过适当的方法应用到呼吸音领域,使模型达到更好的效果,在该算法中,VGGish的参数通过迁移学习获得。(4)为了初步将训练所得模型进行应用,本文基于HTML开发了一个使用深度学习的CNN-RNN融合方法对呼吸音进行分类的Web服务功能,主要使用本文提出的基于VGGish-Bi LSTM方法建立的呼吸音音频分类模型,实现用户上传呼吸音音频,并返回诊断结果的功能。同时,根据本文进行的大量实验的结果表明,综合各个病症类别的分类精确率和总体准确率,与目前现有的呼吸音分类算法相比,本文算法有效提高了对呼吸音相关的各类病症的分类精度。
其他文献
回复式神经网络(Recurrent Neural Networks,RNNs)是深度学习领域中的一种基础的人工神经网络,其作为处理序列数据的记忆模型被广泛应用。如何处理好梯度消失与梯度爆炸问题一直是训练RNN的关键和难点。长久以来,人们提出了多种方法来解决RNN训练时的梯度问题,不断设计新的RNN变体用以处理更长的序列。尽管许多经典的模型已经被提出,如何使RNN模型在快速应对序列中短期变化的同时捕
计算机视觉发展过程中,人体姿态估计任务一直备受关注。在工业界和学术界,姿态估计任务也是极具挑战性的任务之一,目标是使机器尽可能的检测出人体样本中关键节点,比如鼻子、左右肩、脚踝、手腕。随着深度神经网络的引入和应用,人体姿态估计任务往往是预测人类行为规律的基础研究任务,为行人检测、样本重识别、特殊行为检测、人机交互等任务提供了基础预测能力。当前主流的人体姿态估计网络框架分为两种应用型网络,即人体结构
在工业产品的生产过程中,通常会无法避免地产生一些表面缺陷,因此需要检测出产品的表面缺陷以便及时发现问题并且对产品质量加以控制。与人工检测方式相比,基于计算机视觉的工业表面缺陷检测方法,具有成本低、安全性好、效率高、灵活性好等诸多优势,已成为自动化缺陷检测系统的重点研究方向之一。针对工业生产中产品的表面缺陷检测问题,本文设计了一种基于计算机视觉的深度学习平台,在表面纹理较规律的缺陷检测任务中取得了很
近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过
光纤通信向着高速率、大容量、远距离传输的目标发展,由于光纤损耗,需要使用光学放大,为增加传输距离,必须相应地使用越来越多的光放大器。光放大器也使噪声放大,为保持较高的信噪比,信号光功率需要增大。然而,当光信号功率超过一定值时,光纤内的非线性会增强,产生非线性干扰噪声。在长距离、高激光发射功率的光通信系统中,光纤中累积的非线性效应成为影响系统通信性能的主要因素,信号由于受到非线性而产生畸变,使得通信
推荐系统被广泛应用于互联网的各个领域中,用来解决当前时代信息过载的问题。它不仅可以帮助用户快速筛选出感兴趣的内容,也为互联网公司创造出了巨大的商业价值。针对用户进行分析是个性化推荐系统的基础和前置工作。基于对某个用户的分析可以发现这个用户对不同物品感兴趣的程度。用户、物品和其他一些附属信息,比如标签信息、物品种类,共同组成了一个异构的信息网络。一般情况下,推荐算法会直接把用户描述为显式或隐式的评分
不断发展的传感、计算和通信技术驱动着信息物理系统和物联网深入到了社会的各个领域,如智能工业过程、智能电网和智能交通等。在工业控制领域,传统的基于可编程逻辑控制器或微控制器的控制系统面临着计算能力较弱、交互能力较差等问题,而随着边缘计算模式的出现和应用,为工业控制系统中智能和复杂控制方法如基于迭代的最优和鲁棒控制方法、模型预测控制等的应用提供了新的思路。本文以工业温度场控制为场景,尝试将边缘计算与控
如今,机器学习已经成功地应用于信息检索、数据挖掘以及计算机语音识别等多个领域。但是,由于其功能和工作机制上的复杂性,实际应用与学习中大多数用户将机器学习模型视为黑匣子,且高性能模型的开发需要耗时的、反复的试验过程。所以,对机器学习的可解释性进行研究探索是一个很重要的命题。学术研究人员需要更加透明和可解释的系统,以更好地理解和分析机器学习模型。可视化分析是将数据转换成富有信息的视图的新兴技术,它利用
如今,卷积神经网络已成为深度学习中的主流模型之一,它在计算机视觉、自然语言处理等任务中具有显著的性能表现。卷积神经网络具有平移等变性,即对输入的平移等效于对输出的平移。然而,对于其他非平移变换,如旋转、放缩,卷积神经网络并不具有等变性。为了解决上述问题,群等变性卷积神经网络由此提出。此外,为了处理非欧几里得空间(如球面)中的图像数据,人们提出了适用于球面流形的球面等变性卷积神经网络。然而,现有的等
自动驾驶可以有效缓解交通安全事故,提高交通运输效率,极大的改善现有交通环境。同时自动驾驶的落地也是国家新基建的重要组成部分,因此相关技术的发展有着重要的现实意义。目前自动驾驶方案大致分为两种,基于规则的方案需要人工设计环境感知算法,并结合高清地图完成车辆定位、路径规划、决策控制等一系列算法完成。整个系统设计复杂、成本高昂,由于各场景之前还存在边界模糊,所以整个系统并不是完全可观。基于端到端的自动驾