多尺度特征融合深度神经网络架构研究与应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:ttytty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多经典的深度学习网络模型中,多尺度特征融合结构都发挥着重要作用。多尺度意味着在不同粒度下对信号数据进行观察。当粒度更大更稀疏时,网络能够学到整体的趋势,获得全局性的高层特征;当粒度更小更密集时,网络能够学到更多的细节,获得局部性的底层特征。将不同粒度学习到的特征通过独特的空间通道均衡方法融合在一起,促使网络同时注重纹理和结构,从而保证模型的高效性和鲁棒性。在本研究中,我们将主要聚焦于深度神经网络中的多尺度特征融合技术,结合计算机视觉领域里的图像修复问题和工业4.0时代下的机械智能诊断问题,针对性地创新网络结构及其算法。同时我们还对多尺度特征融合技术的内涵和发展进行了详细的综述,对目前流行且于本研究具有借鉴意义的经典网络架构做出了介绍。具体而言,本文的研究内容可以概括为:(1)针对图像存在局部损坏或者缺失的数据集进行数据增广(Data Augmentation)的问题,我们首先将其归类到图像修复领域,问题的难点就是如何在保证图像修复效果的同时,复用图像修复模型中的解码器部分实现数据增广。为此我们把目光从对抗生成网络转移到自编码器,提出了多尺度特征均衡融合的多层次变分自编码器(Multilevel VAE for Image Inpainting,MVAE-FI),改变了传统自编码器单一层级的结构,提升了模型的生成能力,并且在编解码器之间引入多尺度特征均衡融合模块,鼓励模型关注图像细节纹理和整体语义特征。实验结果表明MVAE-FI无论是在图像修复的直观视觉效果上还是在可量化的评价指标上,都有着令人满意的效果,与此同时通过复用MVAE-FI中的解码器可以实现数据增广的目标。(2)机械智能诊断领域中模型的诊断能力与其规模大小成正相关性,然而计算量较大的模型很难实际应用于工业生产环境中,针对如何平衡模型诊断能力与其规模的难题,我们首先提出了多尺度特征融合的密集连接深度神经网络(Multi-scale Feature Fusion Densely Connected Deep Network,MSDC-NET),利用多尺度特征融合技术增强了模型的感受野,通过密集连接技术避免了模型出现梯度爆炸的问题。最终网络整体架构和局部残差构件都经过精心设计的MSDC-NET模型,在三类数据集上的表现都远远超出目前主流的机械智能诊断算法。紧接着,我们在具有高精度分类水平的MSDCNET模型的基础之上,对轻量级CNN模型进行了知识蒸馏,使其诊断准确率大幅提高。由于轻量级CNN模型所需的计算和存储设备要求远远低于深度网络,从而对机械智能诊断技术在工业实践中的推广起到了积极的作用。
其他文献
近年来,癌症患者越来越多,并且癌症的死亡率也在不断增加。对于大多数癌症患者来说,传统的物理和化学治疗方法不仅昂贵而且效率不高。此外,一些抗癌药物在杀死癌细胞的同时也会损害正常细胞,患者长时间服用这些药物会使癌细胞产生耐药性。因此,迫切的需要开发新的更加有效的药物。而多肽作为一种高特异性、选择性和对人体伤害小的安全可靠的治疗候选药物,近年来备受研究者的青睐。随着多肽药物数据的增加以及机器学习算法的快
学位
由于小目标具有尺寸小、分辨率低的特点,一直以来是目标检测任务的难题。小目标的识别不能单纯使用一个尺度的特征图预测,需要针对小目标的特点设计合适的检测模型,利用全局语义信息和多尺度特征图进行识别。本文从特征增强的角度出发,提出了新颖的特征融合模块、注意力模块、特征金字塔模块,并将这些模块应用到经典的检测模型中,以提升小目标检测的精度。如下为本文针对提升小目标检测精度做的三个主要工作:1)第一个工作是
学位
曲线拟合与重构是计算机辅助几何设计领域中一个重要的基础研究课题,其相关技术有着广泛的应用。B样条具有优秀的形状表达能力、良好的局部控制能力和连续性,是在曲线拟合中最常见的方法。由于曲线拟合问题中基函数的选取有着重要的影响,因此根据具体问题和约束的不同,学者们也会提出不同于B样条的基函数应用其中。而正交函数系作为一类有着诸多优势的函数却很少被用于曲线拟合,其中一个重要的原因是传统的连续正交函数系基函
学位
近年来,人工智能在医学领域大放异彩,特别是在图像分割领域,取得了很大的进展,现代医学中,医生往往根据不同的医学图像诊断病情,并作出相应的治疗计划。医学图像多种多样,每种图像都有其各自的特点以及擅长的地方。如计算机断层扫描(CT)、超声成像、磁共振成像(MRI)等。借助机器学习算法,我们使用计算机程序处理不同模态的医学图像,帮助医生提高诊断效率。在癌症的治疗中,放疗是最重要的手段之一,对绝大多数癌症
学位
纺织品瑕疵检测是纺织品质量监控的关键环节。视觉显著性可以模拟人类的视觉机制,快速定位具有显著性特征的目标,因此基于视觉显著性的纺织品瑕疵检测很有研究价值。本文研究对象为图案具有复杂周期性变化的纺织品,根据纺织品图像具有周期性的特点,利用图像的自相关性取得最佳分块模板,解决传统算法提取图像周期波动较大的问题。针对原上下文视觉显著性算法仅考虑局部显著差异性的不足,同时计算相邻像素块的全局和局部显著差异
学位
在精准医疗时代,从多组学水平对癌症进行亚型分型成了研究的热点。基于多组学数据进行癌症亚型研究可以利用不同组学上的信息融合,在分子层面更准确的识别癌症亚型。本文将机器学习的方法应用在多个癌症数据集的多组学数据上,通过提出不同的算法对癌症亚型进行研究,发掘不同癌症亚型中的生物标志物,为推动精准个性化医疗作出贡献,主要从以下三个方面开展研究工作:1.CSNF聚类算法及肿瘤亚型研究。基于CCA算法和SNF
学位
推荐系统作为一种高效的信息过滤工具,可以有效地缓解“信息过载”问题。协同过滤是推荐系统中使用最广泛的算法,它通过用户的历史行为分析用户偏好,建模用户特征,为用户推荐感兴趣的项目。由于协同过滤需要使用用户的历史行为数据,而这类数据相对于项目数量往往很少,因此协同过滤容推荐面临着严重的数据稀疏问题。最近,由于用户与项目的关联可以构成天然的二分图,基于图神经网络的推荐越来越受到关注。通过用户-项目二分图
学位
TSK模糊模型是众多模糊模型之中最具影响力也是应用最广泛的一种,它具有高可解释性和强大的逼近能力,已经在很多领域得到了成功的应用。但是,在实践中,模糊模型的性能取决于可用数据的数量和质量,需要充分的训练才能获得较好的泛化能力,而集成学习为构建模型提供了一种有效的方法,它通过结合多个学习器来完成学习任务,通常可以获得比个体学习器更加优越的泛化性能。但是当数据不平衡时会导致系统的训练精度下降,泛化能力
学位
肌内脂肪(Intramuscular fat,IMF)是一种肉质属性,定义为可食用肌肉中分散的脂肪颗粒的总数量,代表了肉的脂肪水平,广泛认为这一特性对猪肉的烹饪质量(即风味、多汁性)、消费者满意度以及消费相关健康问题有很大影响。过去常通过化学以及光谱等方法来测定IMF含量,但这些方法需屠宰后采样,为了在育种中选择肉的质量特征,开发体内方法是非常重要的。CT是无创断层图像,密度分辨率高,可将细小的点
学位
肝癌的致死率在癌症中位居前列,严重威胁着人体健康。在临床应用中,CT是医生进行肝癌诊断的常用方式之一,从CT影像中对肝脏和肿瘤区域的精准分割,对疾病的诊断和预后治疗具有重要的研究价值。传统分割算法多依赖于先验知识,不利于临床应用中的自动化扩展。近年来,深度卷积神经网络(Deep Convolutional NeuralNetwork,DCNN)被广泛应用在肝肿瘤分割任务上,通过局部感知和参数共享的
学位