基于Xception网络的弱监督细粒度图像分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:war3mx1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的快速发展,计算机视觉领域对图像的分类研究不仅仅局限于识别出物体的类别,更需要在传统图像分类任务的基础上进行更细致地类别划分。通过对现有细粒度图像分类算法和模型的分析研究,提出一种基于Xception模型与WSDAN(Weakly Supervised Data Augmentation Network)弱监督数据增强的方法相结合的深度学习网络应用于细粒度图像分类任务。该方法以Xception网络作为骨干网络和特征提取网络、利用改进的WSDAN模型进行数据增强,并把增强后的图像反馈回网络
其他文献
目前,大多数异常检测算法仅通过正常样本训练模型,但缺乏异常样本,将会造成一定程度的误判。为改善传统算法面临的这一问题,本文提出一种基于有效异常样本构造的异常检测算法。视频中帧与帧间的连续性是一种重要的信息,正常事件对应的视频帧往往平稳变化的,然而异常事件对应的视频帧往往无此规律,利用此特点可以进行异常样本的构造。通过K-means聚类算法得到代表不同类型正常事件的聚类簇,然后结合本文构造的异常样本
期刊
目的 为了更加客观的评估用户体验,拓展用户研究的途径,引入表情识别技术对已有用户研究方法进行优化与探索。方法 以阅读APP为研究载体,表情识别与卷积神经网络算法为技术手段,通过设计人机交互实验将其应用于用户研究过程中,建立用户面部表情与用户主观满意度的映射关系。结果 针对阅读APP“X”,开展了基于表情识别技术和传统问卷访谈相结合的双向设计研究,并采用对比验证的方法得出基于表情识别技术的用户满意度
期刊
为减少交通事故的发生、维护生命财产安全,需要开展驾驶人疲劳状态检测研究。本文提出采用融合眼、嘴、头部特征的方法进行驾驶人疲劳检测。该检测方法首先采用LBP特征检测到人脸,其次通过多级级联的残差回归树算法获取驾驶人面部特征点,并通过3D人脸模型匹配获得驾驶人头部的运动姿态,最后通过融合头部姿态、面部嘴、眼开合度特征的方式建立驾驶人疲劳检测模型并进行训练。与其它检测方法相比,该方法能更加准确的进行驾驶
期刊
断层是控制油气田形成和分布的主要因素,查明断层的形态及分布是油气勘探的重要任务,因此断层识别在油气勘探领域起着重要作用。近年来,深度学习在油气领域的应用越来越多。本文基于Attention-UNet图像分割模型,提出一种改进的网络结构SPD-UNet模型,用于地震断层的图像识别,模型利用神经网络强大的编码和解码功能来实现断层图像的自动识别。SPD-UNet引入了空洞卷积,在扩大感受野的同时可以有效
期刊
基于全卷积孪生网络的视频目标跟踪算法由于在跟踪过程中使用单一模板,因而在运动目标外观发生变化时容易出现跟踪漂移并导致精度下降。因此,提出了一种基于孪生网络融合多模板的目标跟踪算法,该算法可在特征级上建立模板库,并使用平均峰值相关能量和模板相似度来保证模板库中各个模板的有效性,从而对多个响应图进行融合以获得更高的跟踪精度。OTB2015和VOT2016数据集上的测试结果表明,在运动目标外观发生变化的
期刊
气胸是肺部常见疾病之一,目前已有的X线气胸检测方法主要存在两个问题:一是气胸通常与肋骨、锁骨等组织重叠,在临床上存在较大的漏诊情况;二是现有的主流分割算法采用单一或双重阈值策略,导致结果不准确。针对上述问题,本文提出了一种新颖的气胸分割方法。该方法首先对胸片进行对比度限制自适应直方图均衡化,去除噪点并还原图像细节;通过以MBConvBlock为编码器模块的卷积神经网络层提取图像中抽象的深层特征;然
期刊
步态作为一种人体躯干、关节、上下肢及各肌群的周期性行为模式,是可用于身份识别过程的一种重要生物特征。针对现有的步态识别方法大都是基于步态轮廓图或者步态能量图提取的全局特征,而忽视了对细粒度步态信息的有效利用的问题,提出了一种包括全局通路和局部通路的非对称双路识别网络。其中全局通路采用三元组损失函数用于提取步态的全局时空特征;局部通路采用交叉熵损失函数用于识别步态中显著不同的局部特征。此外,在局部通
期刊
目的 为了加强海上交通的安全性,以常见的民用船和军用船为研究对象,针对原始YOLOV3算法在船舶数据集上的检测精度不高、目标框出现误检和小目标漏检的问题,该文提出了改进的船舶检测算法MS-YOLOV3。方法 首先,构建船舶图像数据集Shipdataset,包括数据采集、增强和标签标注,使用维度聚类算法在该数据集中找出合适尺寸的先验框,并应用于相对应的尺度特征图。其次,以Darknet-53的网络框
期刊
为提升目标跟踪算法在复杂场景下的鲁棒性,使算法适应长时跟踪场景,提出结合多层特征融合和短时记忆机制的跟踪方法,提升目标跟踪的鲁棒性。首先,融合卷积神经网络多层特征,提升网络的特征提取能力。然后,在跟踪阶段,引入了短时记忆模块,搜索区域特征分别与初始的基准模板特征和短时记忆的动态特征进行匹配,对得到的响应图进行融合,提升目标跟踪的鲁棒性,通过视频局部信息增强算法对跟踪目标的判别性。在OTB2015和
期刊
呼吸会引起体内器官和肿瘤的运动, 这会显著影响放射治疗的过程和效果. 人体内部膈肌和胸腹部外表面是当前两种与呼吸系统高度相关的结构, 本文对其进行系统研究, 提出了一种新的分步子空间映射(TSSM)算法, 通过对体外胸腹部表面的测量, 来预测体内膈肌的运动. 本文首先采用三维图像分割技术对4D CT图像进行分割, 在不使用标记物的情况下, 准确测量体内膈肌和体外胸腹部表面的位移. 为了解决跨空间的
期刊