基于多模态信息的视频描述算法

来源 :信息技术与网络安全 | 被引量 : 0次 | 上传用户:long060112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和高级语义属性。在编码器阶段,提取视频的静态特征、光流特征和视频段特征,同时设计语义属性检测网络得到视频高级语义特征。为了避免解码器阶段的曝光偏差和训练损失与评价准则不统一的问题,采用基于强化学习的训练算法直接将客观评价准则作为优化目标来训练模型。所提出的算法在公开视频描述数据集MSVD上取得了很好的实验效果。
其他文献
顶层设计是实现高校思政课实践教学规范化、制度化、实效化的迫切需要。顶层设计思政课实践教学的基本路径一是课程化处理,修正实践教学无序状态,其中心任务是编制课程标准;二是
慈善捐赠是具有深刻道德意蕴和时代价值的高尚义举。对慈善捐赠的道德评价,需要处理好财富状况与道德水平、捐赠数量与道德境界、适度匹配与道德良心的关系。人们对被动捐赠行
该文通过文献资料法和专家访谈法对微课在体育院校教学中的应用进行研究.研究表明:微课具有主题突出、目标明确、短小精炼、情境生动、动态性强等特点,在体育院校专业课教学中
实践教学是关系思政课实效性的重要环节。发挥参与者的主体性作用是实践教学成功的关键。高校思政课主体性实践教学模式构建要在把握特征的基础上,从目标、程序、原则等方面着
【正】 中长跑比起其它运动项目按其动作结构、技术等方面因素来分析是比较简单的。然而,从训练的观点来分析,中长跑的训练又是一个极其复杂的过程。这是因为中长距离项目要
也许是观察和思考习惯的使然,我用镜头对广场乃至整个贵阳社会变迁作了二十多年的记录;如果把“视野”再向前延伸,40多年前我还是个孩子的时候,就见证了这个广场的诞生。
<正>北京传统民俗糕点,历史悠久,在民俗糕点中,尤以"京八件"为国人所称道。2008年3月26日,新北京特产"京八件"、"仿膳宫廷御点"正式面市,北京将有460多家网点和超市、旅游景
房地产是整个国民经济增长当中最关键的一个支柱产业,它发展的好坏会影响到整个国民经济发展的速度,而且会影响到整个国民经济发展的质量。本文首先论述了房地产市场的现状,
分析高职英语教学改革中存在的困难,引入校企合作模式,提出高职英语教学改革的策略。
为了有效地解决高校政治理论课程内容与中学相关课程内容的重复问题,在更高的理论层次上帮助高校学生全面认识毛泽东思想是马列主义同中国实际相结合的第一次历史性飞跃的伟