基于多模态双向导向注意的视觉问答

来源 :太赫兹科学与电子信息学报 | 被引量 : 0次 | 上传用户：jenny_408

【摘要】

：

针对视觉问答(VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入softmax分类器,得到问题的预测答案;再结合计数模块提升模型的计数能力。结果表明,该模型

【作者】

：

鲜荣何小海吴晓红卿粼波

【机构】

：

四川大学电子信息学院,四川成都 610065

【出处】

：

太赫兹科学与电子信息学报

【发表日期】

：

2021年01期

【关键词】

：

视觉问答深度协同注意单向注意双向导向注意特征融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于遥感影像和神经网络的城市用地功能分类

城市用地功能分类的准确识别对精准把握城市现状、优化城市空间结构有重要意义。基于此,利用高分辨力遥感影像,提出一种针对中国城市用地功能分类的模型。设计一种多分辨力特征融合的卷积神经网络识别遥感影像中的特定功能区;针对中国城市功能区分布的特点,建立一个用于城市用地功能分类的新数据集。实验显示,本文算法在6种用地功能类型上的分类精确度达88%,表明算法对城市用地功能分类识别具有较高的准确性。最后,通过对

期刊

遥感影像用地功能分类神经网络城市规划

基于二维光子晶体高Q值微波带阻滤波器

为提高无线通信系统的传输质量,提出一种新型的基于二维光子晶体的微波带阻滤波器,该滤波器由线缺陷波导和AAH谐振腔组成.通过改变AAH谐振腔与主波导的距离,增加它们之间的耦

期刊

光子晶体滤波器AAH谐振腔

基于多模态双向导向注意的视觉问答

其他学术论文