基于深度网络的多模态视频场景分割算法

来源 :武汉理工大学学报(信息与管理工程版) | 被引量 : 0次 | 上传用户:dwlqw008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对视频场景中底层特征与高层语义特征之间存在的"语义鸿沟"及多特征融合等问题,根据视频多模态之间时序关联共生的特性,提出了一种基于深度网络的多模态视频场景分割算法,从每个镜头中提取丰富的底层特征及语义概念特征,将其特征向量串联的整体特征向量作为深度网络的输入并进行嵌入空间学习,通过计算两个镜头整体特征向量之间的距离得到语义相似性的度量值,然后最小化时间段内距离的平方和对镜头进行聚类处理,最终得到语义层面的场景。实验结果表明,该算法在分类精度上具有良好的性能,能对视频场景实现有效分割。
其他文献
只听说过高抬贵手,这“高抬贵腿”却也是有效的健身之道。据报载,英国女王伊丽莎白年过古稀,但看上去比她的实际年龄年轻的多,其奥妙所在,就是她掌握了“高抬贵腿”的健身之道,每天
为了研究燃料电池汽车运行工况对燃料电池老化的影响,提出了一种质子交换膜燃料电池(PEMFC)老化机理模型,并与经试验验证的PEMFC多物理场模型耦合,建立了能预测燃料电池性能
针对属性权重完全未知的概率犹豫模糊多属性决策中决策信息的不完全性、外部环境的不确定性及决策者自身风险偏好的问题,提出基于改进距离的概率犹豫模糊多属性决策方法。首
在“大众创新,万众创业”政策引导和信息技术迅速发展的背景下,软件外包行业迅速崛起。针对软件外包新创企业的市场拓展问题,采用文献分析、统计分析等方法,基于社会网络理论
甩挂运输路径规划问题(TTRP)是一个NP-hard组合优化问题,为了探究元启发式算法下求解TTRP时邻域算子的特性,建立了基于禁忌搜索的算法框架,并设计了相应的对比实验来验证。验
历史学科内容繁杂,知识点多,学生常会觉得内容枯燥繁琐、记不住,很容易产生厌学情绪。要提高课堂的教学质量,激发学生对历史的学习兴趣,就要改变单一的灌输式教学方法,在教学
针对当前巧克力3D打印机连续送料难、打印精度低等问题,对现有的各类巧克力3D打印技术进行研究,改善了巧克力3D打印机的机械结构,设计出一款具有连续供料装置的高精度巧克力3
社保基金是用于实施社会保障制度的资金,是从事社会保障活动的物质基础。社保基金的正常运行,可使人们“老有所养、病有所医、壮有所为、残有所济”。①是老百姓的“养命钱”
紧张激烈的NBA刚刚结束第二周的比赛,在西部周最佳球员评选中,姚明继队友麦迪之后当选。在过去的一周,姚明场均贡献27.8分,10.5个篮板和2.8次封盖,带领火箭队打出了3胜1负的
知识产权合作能够整合创新资源,提高创新能力。为促进企业之间或企业与大学/研究机构间知识产权合作进程,考虑政策支持对知识产权合作的影响,将政府作为合作参与主体,构建了