基于先验MASK注意力机制的视频问答方案

来源 :计算机工程 | 被引量 : 0次 | 上传用户:tanli357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽与问题无关的答案,从而增强模型的可解释性。实验结果表明,该模型在视频问答任务中的准确率达到61%,与VQA+、SA+等视频问答模型相比,其具有更快的预测速度以及更好的预测效果。
其他文献
因新冠肺炎疫情影响,2020年中国工程教育专业认证协会没有像往年一样开展线下的自评报告答疑培训。为了保证自评报告的撰写质量,中国水利学会与水利类专业认证委员会联合探索
朗读和背诵可以帮助学生加强语言输入,增强学生英语语感。在教学中,教师可引导学生通过朗读和背诵培养英语思维,从而为学生的英语学习奠定基础。文章以农村英语教学为切入点,
目的探讨案例反思联合模拟体验教育对首诊2型糖尿病患者血糖水平及自我管理行为的影响。方法选择医院2018年9—11月接治确诊的2型糖尿病患者128例,按组间均衡可比的原则分为
在素质教育不断推进的背景下,教师应该找到高中化学课堂教学的突破口,落实核心素养培养,提高学生的化学能力。文章对高中化学课堂培养学生核心素养的相关策略展开探讨,提出聚
跨链技术是区块链领域研究和关注的热点,公证人机制是一种典型的跨链技术手段。针对公证人机制中存在节点信用监督不足的问题,构建基于改进PageRank算法的公证人节点信用评价
为解决超大水位差的客运码头上下船工艺设计问题,结合实际工程项目,提出了斜坡道缆车、垂直电梯、自动人行道等工艺方式,分析了每种方式的关键技术和特点,可为类似工程设计提
以地震科普微信公众号为主要科普传播载体,并以"震知卓见"公众号为例,对地震科普作品的选题进行了分析。创作选题要充分考虑受众的需求,从时事热点事件、震情事件等多角度进行切入;此外,还应考虑选题与科普创作形式之间的关系,找到二者之间能够提升科普传播效果的契合点;选题时可以专栏化,打造地震科普系列作品。文章最后就如何提升地震科普微信公众号科普内容传播力提出了建议。
吉尔吉斯共和国在中亚地区具有战略通道的作用,是中国通往中亚的门户和中国新丝绸之路经济带的重要节点。吉尔吉斯共和国地震监测台网是"一带一路"地震监测台网项目的组成部分。了解吉尔吉斯共和国地震监测台站(网)的分布、运行情况,不仅对优化"一带一路"地震监测台网的布局,而且对提高中亚地地震活动性认知能力,提升该地区防震减灾能力都具有重要的意义。本文研究了吉尔吉斯共和国现有地震监测台网布局,所使用的仪器设备
在新时代背景下,有必要以实践为引导,进行医药类高等院校数学实验课程教学改革。在目前数学实验课程的"算数学"方式中融入数学建模思想,导入模块教学及实践考核,将其改进成"
为进一步改善个性化推荐系统的推荐效果,通过使用强化学习方法对SVDPP算法进行优化,提出一种新的协同过滤推荐算法。考虑用户评分的时间效应,将推荐问题转化为马尔科夫决策过