基于卷积块注意力模块的图像描述生成模型

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:fancysoul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述生成模型是使用自然语言描述图片的内容及其属性之间关系的算法模型.对现有模型描述质量不高、图片重要部分特征提取不足和模型过于复杂的问题进行了研究,提出了一种基于卷积块注意力机制模块(CBAM)的图像描述生成模型.该模型采用编码器-解码器结构,在特征提取网络Inception-v4中加入CBAM,并作为编码器提取图片的重要特征信息,将其送入解码器长短期记忆网络(LSTM)中,生成对应图片的描述语句.采用MSCOCO2014数据集中训练集和验证集进行训练和测试,使用多个评价准则评估模型的准确性.实
其他文献
目的:研究手术室护理中应用围术期护理后对护理质量以及满意度的影响效果.方法:80例手术患者选自(2019年9月—2021年2月),按照护理性质随机分成2组,所有患者均以手术室护理为
针对深度哈希跨媒体检索方法中,语义相似的媒体对象的哈希码在汉明空间内的分布不合理问题,提出了一种新的深度哈希跨媒体检索模型.该模型是在汉明空间内利用柯西分布对现有的深度哈希跨媒体关联损失进行改进,使得语义相似的媒体对象哈希码距离较小,语义不相似的媒体对象哈希码较大,进而提高模型的检索效果.同时,本文给出了一种高效的模型求解方法,采用交替迭代方式获得模型的近似最优解.在Flickr-25k数据集,IAPR TC-12数据集和MS COCO数据集上的实验结果表明,该方法可以有效的提高跨媒体检索性能.
为提高自动化采棉机械的采摘效率和智能化水平,避免误采摘、漏采摘,采用以复杂背景下实现单个棉花检测为目标,提出一种改进的YOLOv4目标检测算法.使用K-means算法进行聚类锚框尺寸的筛选,得到适合棉花数据集的精细化锚框尺寸.同时在YOLOv4算法中引入注意力机制,在其网络结构中添加SENet (Squeeze-andExcitation Networks)模块.在模型训练时,首先在公开数据集上训
目的:探讨脑血管病患者介入手术前焦虑情绪护理相关.方法:将本院收治的脑血管病患者作为研究群体,本次调查时间为患者围术期,主要护理工作介入时间为护理之前,将纳入调查的80
随着僵尸网络的日益进化,检测和防范僵尸网络攻击成为网络安全研究的重要任务.现有的研究很少考虑到僵尸网络中的时序模式,并且在实时僵尸网络检测中效果不佳,也无法检测未知的僵尸网络.针对这些问题,本文提出了基于流量摘要的僵尸网络检测方法,首先将原始流数据按照源主机地址聚合,划分适当的时间窗口生成流量摘要记录,然后构建决策树、随机森林和XGBoost机器学习分类模型.在CTU-13数据集上的实验结果表明,本文提出的方法能够有效检测僵尸流量,并且能够检测未知僵尸网络,此外,借助Spark技术也能满足现实应用中快速检
目的:探究窦性心动过缓患者治疗中心理干预的应用情况.方法:本临床研究中患者共60例,均符合本研究要求确诊病例,患者入院时间自2019年2月开始,自2020年2月终止,随机划分组别(
目的:探究重症监护护理干预对呼吸衰竭患者生理指标和睡眠质量的影响.方法:抽取本院中2019年5月--2020年10月间接收的70例呼吸衰竭患者为实验对象,采用计算机排列法进行分组,
Purpose::As COVID-19 spreads globally and affects people's health, there are concerns that the pandemic and control policies may have psychological effects on
目的:解决病案复印中的常见问题,提高病案复印工作的质量.方法:全面分析病案复印中的常见问题,找出原因并予以改进.结果:病案复印中存在7大问题,分别是病案复印人未带齐相关
针对复杂场景下文本识别流程复杂繁琐、适应性差、准确度低等缺点,本文提出一种复杂场景下文本检测和识别的新方法.该方法由文本区域检测网络及文本识别网络构成,文本区域检测网络为改进的PSENet,将PSENet的骨干网络改为ResNeXt-101,在特征提取过程中加入可微二值化操作来优化分割网络,不仅简化了后处理,而且提高了文本检测的性能.将卷积神经网络和加入聚合交叉熵损失的长短时记忆网络组成文本识别网