自适应视频镜头边界检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:aghdks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频/图像分析一直是计算机视觉领域的热门课题,其理论与应用研究受到广泛关注。人们对视频数据的认识归纳是有层次性的,根据电影的制作过程,它自顶向下可分为电影,故事单元,场景,镜头和帧。由此可以看出,帧是视频的最小组成单元。所以,视频镜头边界检测是进行视频内容分析的首要步骤,是基于内容的视频检索中更高一级的语义、内容分析的基础。  本文在总结分析现有的镜头边界检测技术,目前镜头转换检测算法主要为阈值法,阈值法的关键在于依靠经验人工选择阈值的方法,实质上是将视频边界特征与非边界特征线性化,难以找到合适所有视频数据通用的阈值,不利于实现镜头边界的自动检测。而文献提出了神经网络算法把视频帧场景进行训练学习,但它类似一个黑箱,缺少透明度,不能很好地表达人脑的推理功能。而模糊推理分析能客观地反映现实世界。但单纯的模糊推理无法让系统进行自学习。本文在神经网络的基础上加入模糊推理,提出了一种基于自适应模糊推理(ANFIS)的镜头检测方法。它融合了神经网络的学习机制和模糊系统的语言推理能力等优点,弥补各自不足。由于多媒体视频快速发展,视频数据出现了很多不规则的视频边界变化,为视频边界检测带来了不方便,并且也不能忽略这些特殊变化的边界。然后ANFIS系统训练误差总是在7%左右,无法再有新的突破。因此,必须加入不规则的情况,必须涉及到系统自学习的人工智能过程。  本文提出一种新的镜头边界检测方法。该方法首先提取合适的视频图像特征量,在传统的灰度帧差,直方图的基础上,加入二值信息特征分析。然后通过多次对视频数据进行自适应的模糊推理训练,最后找到合适的模糊规则以及适当补充不规则现象,让系统更好地进行自学习,从而能更准确地实现边界的检测,查准率和查全率达到95%左右。
其他文献
在数字技术的推动下,视频设备市场已经进入从模拟设备向数字设备的转型期,由此引发了巨大的市场需求,其市场价值更是以千亿元计算,市场潜力不可估量。高清晰度电视的研究一直
学位
目的 从基层医院角度对老年原发性高血压患者健康教育效果进行知-信-行(KAP)现状调查.方法 选择2017年6月-2019年6月就诊于沈阳市铁西区中心医院的老年原发性高血压患者531例
铁电材料的电性能主要由电滞回线、I-V特性和开关特性等反映出来。铁电材料在电极化强度与电场强度关系上呈现电滞回线,在电流与电压关系上呈现I-V特性,在电流与时间关系上呈
文章对晚期浸润性乳腺癌的诊疗策略及预后等进行介绍.
文章对基层卫生人员必须掌握的体格检查操作技能进行介绍.
射频功率放大器的主要功用是以高效率输出大功率,它主要应用于各种无线发射机中。射频信号的功率放大,其实质是在输入射频信号的控制下将电源直流功率转换成射频功率。  随
褐马鸡(Crossoptilon mantchuricum)是一种我国特有的中型陆禽,属国家Ⅰ级重点保护野生动物,IUCN红色名录易危物种。目前其野生种群数量约为17900只,分布区域局限于陕西省、
大功率超高速半导体开关RSD(Reversely Switched Dynistor)是一种基于可控等离子层换流原理的新型固体开关。由于采用了可逆注入控制,使得其恢复时间为微秒数量级,其功率高达
为了解辽宁省医疗质量控制工作现状,辽宁省医疗质量控制管理办公室制定了辽宁省省级质控中心工作统计表和电子档案,并收集相关数据,对辽宁省医疗质量控制工作开展情况进行调