小样本下基于Wasserstein距离的半监督学习算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:aolongjiutian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于大规模标记数据集的深度神经网络模型在图像领域展现出优秀的性能,但是大量标记数据昂贵且难以收集。为了更好地利用无标记数据,本文提出了一种半监督学习方法WassersteinConsistency Training(WCT), 通过引入Jensen-Shannon散度来模拟协同训练并组织大量未标记数据来提高协同训练效率,通过快速梯度符号攻击施加的对抗攻击来生成对抗样本以鼓励视图的差异,将Wasserstein距离作为网络差异约束的度量,以防止深度神经网络崩溃,使网络在低维流形空间上平滑输出。
其他文献
在行人重识别任务中,通常伴随着相机角度、场景变化、行人姿态变化等问题,为此本文提出一种基于注意力机制和空间几何约束的行人重识别方法。首先,构造一种深度学习网络,通过注意力机制有效挖掘并提取行人图像的空间特征。然后,利用空间几何约束将空间特征进行分解,分别计算相应的子空间特征及其空间组合特征,得到描述不同空间关系的局部特征。将描述空间关系的局部特征与全局特征相融合,从而构造出行人身份重识别的全局-局
期刊
目前利用深度学习进行多视图深度估计的方法可以根据卷积类型可以大致分为两类。其中,基于2D卷积网络的模型预测计算速度快,但预测精度较低;基于3D卷积网络的模型预测精度高,却存在高硬件消耗。同时,多视图中相机外部参数的变化使得模型无法在物体边缘、遮挡或纹理较弱区域生成高精度预测结果。针对上述问题,本文提出了基于3D卷积的语义导向多尺度多视图深度估计算法,在保证预测精度的同时降低硬件消耗。同时针对遮挡、
期刊
研究低成本和便携的红外成像技术是最近几年带电检测的发展趋势,为减少红外检测环境、红外传感器以及其他因素的影响,解决红外检测中红外图像含噪声干扰、模糊和对比度低的问题,文章设计了一种基于灰狼自适应阈值分割和改进模糊增强的红外图像NSCT增强算法。对原始红外图像进行NSCT域变换;变换后含有噪声的高频分量采用VT去噪后,接着采用改进模糊增强处理;对变换后含有电力设备主体的低频分量进行灰狼自适应阈值分割
期刊
针对目前多数人心理状态处于亚健康的问题,本文设计了一种基于时空注意力的双向长短时记忆(LSTM)网络,以实现微表情图像特征提取及识别,从而了解人们试图掩饰的情绪。该网络由双向LSTM模块、空间注意力模块及时间注意力模块三大部分组成。将微表情视频图像作为输入,所学习的网络能够有选择性地聚焦于每帧有显著区别的动作单元,并对不同帧给予不同程度的关注度。同时,考虑到模块之间的相关性,还设计一个新的正则化的
期刊
针对YOLOv3检测算法对小目标、遮挡目标检测时存在识别率低和识别精度不高的问题,论文提出一种融合DBSCAN的改进YOLOv3目标检测方法。首先在YOLOv3网络中增加DBSCAN聚类算法,其次对检测目标进行提取,实现数据集多尺度聚类,得到初代特征图,然后通过改进K-means聚类算法确定锚点位置达到更好的聚类,最后在VOC2007+2012数据集和MS-COCO数据集上对改进YOLOv3算法进
期刊
非结构化道路一般没有车道标识线且道路边界模糊,区分道路区域与背景区域难度较大。针对现有非结构化道路识别方法存在全像素域计算分类处理实时性差、易受噪声数据干扰等问题,提出一种基于SLIC(Simple linear iterative clustering)超像素分割和改进区域生长算法的非结构化道路识别方法。首先利用均匀化初始聚类中心的SLIC算法生成低分辨率超像素特征图。在此基础上,利用聚类算法与
期刊
针对熔解曲线图像中峰值分类的问题,本文提出了一种基于多尺度融合的卷积神经网络(CNN)分类模型。首先,通过空洞卷积获取到的多尺度上下文信息与残差模块提取到的特征信息相融合,弥补了深层网络丢失全局信息的缺点。然后,采用随输入而变化的动态滤波器使网络学习更加准确。此外,为了训练本文的模型,创建了熔解曲线的数据集,其中包括平衡数据集和不平衡数据集。本文使用六个基于分类的评价指标来与六个基于深度学习的分类
期刊
为提高对地观测卫星搜索海上船舶效能,提出了一种根据卫星对地观测幅宽和船舶最大航速划分区域时空维度的时变网格模型,将船舶航迹预测问题转化为时变网格转移概率预测问题,有效降低了多步预测的复杂度。改进了序列到序列(Sequence to Sequence,Seq2Seq)模型,通过对搜索区域内大量历史航迹的学习,实现了较高精确度的多步时变网格转移预测。设计了面向时变网格的卫星观测任务规划算法,以实际AI
期刊
超声医学影像具有无创伤、成本低等优势,但成像设备的特性限制了可同时呈现的影像视野。全景拼接技术基于超声探测装置获得的局部图像, 通过拼接融合获得观察视野更大的医学影像,为临床诊断和医患交流提供更直观、全面的信息。但受成像条件影响,获得的局部超声医学图像精度不高、噪声多,传统全景拼接方法处理效果不理想。针对上述问题,提出基于改进的K-MEANS聚类算法的模板融合拼接方法进行超声医学影像拼接。与传统的
期刊
深度人脸表情识别是神经网络应用于模式识别上一项极具挑战性的任务。相对于身份认证和特征点识别等人脸识别任务,表情识别任务中存在着大量的冗余信息,要得到好的效果,需要更精确的分类。多数研究关注点在数据的泛化性和网络结构上,而忽视了数据的类间关系。本文提出了一种基于类间分析的深度残差表情识别网络RMRnet,首先将数据通过骨干网络Resnet18得到混淆矩阵,进一步得到召回率矩阵分析类间关系;然后,凭借
期刊