注意力机制海洋场景图像理解算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:a7753834
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对复杂海洋场景(目标多尺度、对象多样化、风格差异大、时空强关联且存在不确定性目标)特点,研究基于注意力机制的复杂图像有效特征提取方法,提出一种基于CNN和LSTM网络相结合的复杂海洋场景图像中文描述生成模型;结合jieba分词工具,实现了对复杂海洋场景监测图像的自动翻译。利用91卫图助手及无人机高清影像数据,建立模型并对算法进行验证。结果表明,Inception-v4比VGG16模型有更强的复杂特征提取能力,在相同数据集下,Inception-v4模型的图像分类能力高出约5.3%左右;基于卷积
其他文献
高光谱图像有效压缩对于实现实时传输具有重要意义。本文将光谱线性分解引入到高光谱图像高效压缩中,根据高光谱图像的线性混合模型,将高光谱数据分解为端元与丰度的乘积,编码端对原始端元与映射后的丰度进行JPEG-LS无损压缩。解码端利用解码后的端元与丰度相乘进行原始图像的重建,并探讨了端元数量对于率失真性能的影响。仿真实验结果表明,该方法能够获得良好的压缩性能。
期刊
为了研究土卫六探测器在地球大气和土卫六大气中飞行时气动热环境的差异,采用数值模拟的方法分别对地球大气成分和土卫六大气成分下探测器前方流场内气动热环境进行了研究,得到如下结论:与地球大气条件相比,土卫六大气条件下探测器表面的热流密度较高,其峰值可达到地球大气条件的1倍以上.探测器表面的热流密度先随着高度的减小而增加,而后当速度小于一定程度时热流密度开始减小.CH_4在激波层内发生较大程度的解离反应,
期刊
在人机交互领域,精确的人手指尖检测对交互的丰富度、灵活度有很大影响。然而,由于指尖的尺寸较小,精确、鲁棒的指尖检测目前仍然是一项颇具挑战性的任务。为了提升指尖检测的准确率与实时性,提出一种基于深度卷积神经网络的指尖检测模型UGF-Net(Unified-Gesture-and-Fingertip- Network)。该模型可以同时进行指尖检测与手势识别,利用YOLO算法来提取手势区域,通过FCNN
期刊
目前深度学习算法已经广泛应用于步态识别领域,但是大多数现有方法通过卷积神经网络提取步态全局特征时,忽略了许多包含关键步态信息的局部特征,在一定程度上削弱了步态识别的精度和提升潜力。针对上述问题,提出了一种结合注意力卷积神经网络与分块特征的跨视角步态识别方法,该方法以步态轮廓图序列为输入,首先每帧图片分别经过相同结构的注意力卷积神经网络融合成整体特征,在网络中加入有效的注意力机制CBAM能显式地建模
期刊
针对低照度环境下采集图像存在低信噪比、低分辨率和低照度的问题,提出了一种基于稠密连接网络(DenseNet)生成对抗网络的低照度图像增强方法。首先,利用DenseNet框架建立生成器网络,并将PatchGAN作为判别器网络;其次,将低照度图像传入生成器网络生成照度增强图像,同时利用判别器网络负责监督生成器对低照度图像的增强效果,通过生成器和判别器二者间的博弈不断优化网络权重,最终使得生成器对低照度
期刊
云是一种常见的天气现象,云状是天气预测的关键特征。目前,地基云图像中的云状观测主要依赖于气象观测员的目视观测,十分依赖观测员的经验,实时性和效率较低。针对这一问题,提出使用深度学习的方法进行地基云状检测识别。首先设计了一种新的目标检测边界框损失函数UIoU,将其应用于YOLOv3算法上。并且使用了K-means聚类算法重新设计了适用于地基云状数据集的先验框尺寸,使得边界框回归更加精确和稳定。实验结
期刊
由于水下鱼类图像采集困难,现有的数据集主要以视频提取为主,采集到的鱼类图像存在背景环境复杂、像素低下等问题,使得细粒度鱼类图像识别任务难度较大。针对上述问题,提出了一种基于空间域注意力机制和分层精简双线性特征融合的网络。识别网络可进行端到端的训练,由两部分组成:第一部分是以空间变换网络(STN)为注意力机制的背景过滤网络;第二部分以vgg16网络作为特征提取器,根据高层卷积部分对鱼类图像细粒度特征
期刊
在新冠肺炎疫情背景下,针对自动检测人脸是否规范佩戴口罩的问题,本文提出了一种基于HSV+HOG特征和SVM的人脸口罩检测算法。首先使用RetinaFace人脸检测算法检测出人脸和五个特征点坐标,在人脸上使用特征点定位到口鼻区域,提取该区域的HSV+HOG特征并使用SVM进行训练,实现对有无佩戴口罩的检测;然后使用RetinaFace把检测目标定位到人脸的鼻尖区域,使用YCrCb椭圆肤色模型检测鼻尖
期刊
在复杂路况下的行人检测中,行人尺寸变化大。导致小尺寸行人漏检率高,增加了行人检测的难度。为了降低行人检测漏检率,提高行人检测精度,本文在Cascade RCNN(级联区域卷积神经网络)的基础上,将浅层特征与深层特征融合,进行深层特征对浅层特征的特征增强,提高深层信息的利用率,并且增加了一条浅层到深层的通道,将浅层信息直接向上进行传递,提高浅层空间信息的利用率;将行人分类和预测框回归的全连接层改为解
期刊
针对异源图像配准中,因传感器物理特性差异造成的待匹配特征维度较高,稳定性较弱,配准质量较差等问题,本文提出一种基于SIFT的异源图像配准方法,首先结合相位一致性和改进的SIFT算法以获得稳定的特征,然后利用NNDR方法初匹配,接着提出了一种JEED方法再匹配,最后采用MS-SIFT方法优化匹配点对来提高图像配准质量。实验结果表明,相比于现有方法,本文所提出的方法能够提取可靠稳定的特征,获得了较高配
期刊