结合自底向上注意力机制和记忆网络的视觉问答模型

来源 :中国图象图形学报 | 被引量 : 4次 | 上传用户:FollowMyHeart88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的现有大多数视觉问答模型均采用自上而下的视觉注意力机制,对图像内容无加权统一处理,无法更好地表征图像信息,且因为缺乏长期记忆模块,无法对信息进行长时间记忆存储,在推理答案过程中会造成有效信息丢失,从而预测出错误答案。为此,提出一种结合自底向上注意力机制和记忆网络的视觉问答模型,通过增强对图像内容的表示和记忆,提高视觉问答的准确率。方法预训练一个目标检测模型提取图像中的目标和显著性区域作为图像特征,联合问题表示输入到记忆网络,记忆网络根据问题检索输入图像特征中的有用信息,并结合输入图像信息和问题表示
其他文献
目的高分辨率遥感图像通常包含复杂的语义信息与易混淆的目标,对其语义分割是一项重要且具有挑战性的任务。基于Deep Lab V3+网络结构,结合树形神经网络结构模块,设计出一种针对高分辨率遥感图像的语义分割网络。方法提出的网络结构不仅对Deep Lab V3+做出了修改,使其适用于多尺度、多模态的数据,而且在其后添加连接树形神经网络结构模块。树形结构通过建立混淆矩阵、提取混淆图、构建图分割,能够对易
利用构造性方法,证明了:(1)n@→C5是优美图的充要条件是n≡0(mod2);(2)当n≡0(mod2),1≤i≤k时,优美图n@→C5中→C5(i)的弧优美值之和为2(q+1),当k+1≤i≤2k时,→C5的弧优美
中国改革开放以来,酒店业快速发展,先后经历了从国有招待所到现代化酒店、从经验管理到酒店管理的一系列转变过程,酒店业已经成为国民经济中发展迅猛并率先接近国际水平的行
高校继续教育质量管理是全面质量管理理论在教育领域中的应用,它是高校继续教育的重要组成部分,对高校继续教育的健康、可持续发展具有非常重要的意义。从理论层面上讲,高校继续
期刊
物理知识是自然科学的基础,在物理学习中,要学会物理学的研究方法.高中阶段学生要想学好物理,首先培养学科情感,了解学科特点,掌握正确的学习方法和养成良好的学习习惯.
贫困地区的脱贫发展问题是中国“三农”问题的重中之重,贫困地区农村合作医疗服务体系建设则是贫困地区脱贫发展的基础性工程。改革开放以来,我国贫困地区农村合作医疗服务体系
期刊
公务员考录制度是公务员队伍的重要入口,我国自推行公务员考试录用制度以来,初步建立起了“公开、平等、竞争、择优”的考录工作机制。公开招考开阔了机关选人视野,为机关补充了
我国自改革开放以来,中国广大农村的经济生活条件极大改善,广大农民的温饱问题基本得到了解决,并且在沿海及内陆一些经济发达的地区,村民的生活水平已经达到更高层次的水平,但是,农