影视视频场景结构解析及识别技术研究

被引量 : 0次 | 上传用户:liongliong430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字多媒体资源日益成为人们日常文化生活中的重要组成部分,对大量的影视视频进行场景结构分析和场景识别是基于场景语义的视频内容检索的基础。场景边界检测可以将影视视频分割为以场景语义为单元的视频片段,而对视频场景片段进行场景标签的自动标注可以得到视频片段的场景语义内容。针对基于场景相似图的视频场景边界检测算法计算量大的问题,采用基于滑动镜头窗的相似镜头聚类算法,对满足时间局部性的镜头进行聚类,并根据影视视频的场景发展模式,对同场景内的交错镜头类和相似的相邻镜头类进行合并,从而得到视频的场景结构单元。同时,针对只使用镜头视觉特征进行相似度计算容易造成运动场景过分割的问题,同时对镜头提取运动信息,使用镜头内视频帧间的视觉变化来衡量镜头运动量,并使用视觉相似度和运动信息的加权之和进行镜头相似度计算,由于考虑了镜头内的运动情况,可以有效解决打斗、追逐等运动场景的过分割问题。传统的基于底层特征的图像和视频表示方法,往往包含的语义信息有限,在处理高层语义任务时局限性较大。图像中包含的物体是一种很重要的视觉语义元素,使用Object Bank特征进行图像表示,在图像场景识别等视觉语义处理任务中取得了很好的效果,本文将Object Bank方法扩展到视频中,使用一组在影视视频常见场景中的代表性物体的识别器的识别结果对视频片段进行表示。首先对视频场景片段关键帧提取物体识别的统计信息,并将视频场景关键帧集合的最大池化和平均池化结果作为视频场景片段的Object Bank特征,使用SVM分类器进行视频场景的训练和识别。基于Object Bank的视频表示方法,在街道、卧室、餐厅、客厅的场景识别实验中,取得了很好的效果。通过视频场景边界分割和场景识别,可以获得影视视频的场景结构和场景语义内容,从而为基于场景的视频内容检索提供基础。同时,使用ObjectBank特征进行视频表示,包含了视频的物体语义信息,可以同时为影视视频提供基于物体内容的检索支持。
其他文献
传统高强钢板热冲压中,板料整体都要进行快速淬火冷却,从而获得整体均匀的高强度零件。高强度零部件在汽车领域应用相当广泛,然而有些零部件不要求整体高强度对变强度要求比较高
本文是作者所写的艺术人类学视野下的新艺术史观——以中国陶瓷史的研究为例的系列文章之一,旨在以艺术人类学的视野重写中国陶瓷史。笔者遵照费孝通先生提出的"‘文化自觉’
1995年我国高校正式走入社会的中心,高等教育为地区经济服务成为高等教育发展的必然趋势。目前,辽宁省实施“三大区域经济板块”及沿海“五点一线”经济战略,结合本省企业对
通过18个不同Cu(3.24%~4.16%)、Li(0.94%~1.44%)含量的0.4Mg+0.4Ag+0.4Zn复合微合金化Al-Cu-Li合金,研究总结了T8时效处理时Cu含量及Li含量对铝锂合金强度和微观组织的影响,并采用
本文探讨了涉入度对品牌延伸评价体系中两个主要因素(原产品认知质量及原产品与延伸产品之间的相似度)的调节作用,结果表明:一方面,涉入度调节了原产品质量及相似度在消费者
大学校园文化是人类文明体系中非常重要的组成部分,它既具有文化的普遍性,又有大学自身的内在规定性和独特性。大学校园文化建设对于启迪思想、培育具有人文精神的合格人才起
尽管基于微课的翻转课堂教学模式发挥重要作用,但目前微课设计不合理、教学实施不到位、保障措施缺乏。为弥补这些不足,文章提出基于微课的翻转课堂教学模式设计与实施对策,
本文试图运用跨文化交际理论 ,从文化和政治的角度探讨《印度之行》中的误读 ,以及造成误读的根源。笔者认为 :民族、国家间的不平等 ,民族文化之间的差异 ,缺乏在异文化环境
伴随着中国经济的快速发展,中国社会开始进入社会转型期,各种社会问题和矛盾逐渐显现。党中央提出加强和创新社会管理的新主张,要求采取创新的方式对社会进行有效管理。农村社会
我国沪深300股指期货上市已三年有余,它在中国期货市场上交易活跃,从其整个市场的流动性、持仓机构的风险控制水平看来,我国的股指期货市场已经日趋成熟。但是沪深300股指期货是