基于视频信息的新闻结构分析和口播镜头检测

来源 :四川大学 | 被引量 : 0次 | 上传用户:rstkjs123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们在多媒体信息制造、存储与传播方面取得的重大技术进步,多媒体信息和数字视频已经成为日常生活中不可或缺的一部分。爆炸式增长的多媒体信息资源迫切需求自动多媒体信息分析、处理和归类技术。在这样的背景下,多媒体信息处理和检索技术成为近年来各研究机构关注的重点问题。 限于技术的局限性和有限的处理速度,建立一种通用的视频分析/处理框架是不大可能的。在宏观上看,目前国内外的研究主要集中在新闻、电影、电视剧、体育等几类视频素材的分析上。本文提出了一种新的通用镜头边界检测及关键帧提取算法,以及针对新闻中固定不变的一类镜头——口播镜头的识别算法。算法基于非压缩域处理,达到了较好的检测效果和运算速度,充分满足应用的需求。 本文提出的镜头边界检测算法融合了视频颜色的信息和运动的信息,用主色直方图描述颜色的变化,用图像块运动度描述运动的强弱,并将二者结合起来划分镜头边界。关键帧是描述镜头内容的一种有效手段,传统的关键帧提取方法基于镜头内所有帧聚类,不利于处理流式的视频信息。因此本文提出一种基于子镜头的非监督聚类算法,算法能适用于流式视频处理并不失其合理性。 口播镜头检测是新闻视频处理的一种重要的手段,不少文献都提出了自己的做法。本文提出的算法充分分析了口播镜头的规律性特征,采取了多规则融合的检测办法。算法运用了大量口播镜头规则。因此有效的减少了计算量。在P4 2.66GHz,512M的Windows XP的平台上运行本文口播镜头检测算法达到了94.7%的查全率和94.7%的查准率,处理速度为144帧/秒。
其他文献
期刊
重复使用运载器(RLV)是各航天大国发展新型航天器的必然趋势,本文针对重复使用运载器能量管理段的制导技术展开研究,传统的航天飞机制导方案的工程实现过于复杂,本文提出了一种分
本文选择用状态反馈精确线性化方法,将响应型船舶运动的非线性数学模型进行线性化,再利用基于闭环增益成形算法的鲁棒控制器进行控制。 本文分成两部分,首先使用状态反馈
随着计算机的诞生和信息技术的飞速发展,字符识别的内涵已经由最初的一种阅读辅助工具发展成为一种处理数据和信息的重要手段,得到了极为广泛的应用。手写数字识别作为光学字符
期刊
执行器作为控制系统的执行终端部件,由于经常工作在恶劣的工作环境中容易出故障。执行器的故障往往对控制性能产生直接的影响,因此及时准确的检测出执行器发生的故障,对于保
期刊
大多数发酵工厂所应用的发酵参数(主要指温度、pH、溶解氧、补料速率)往往由经验或经典的试验数据而来,并将其作为单一给定值控制整个发酵过程,这容易造成发酵单位低且波动性大
自抗扰控制器由于其算法简单、容易实现、鲁棒性好、抗干扰能力强等优点而逐渐成为现代先进控制方法的研究热点,它不需要被控对象精确的数学模型,利用扩张状态观测器对系统内
伴随着现代工业生产过程的日渐复杂化、机械化,高效的生产过程监测、故障诊断和质量预测对于确保生产安全,提高产品质量是至关重要的。由于DCS和智能化仪表的广泛发展和应用,能够测量的变量以及可以获取的过程数据越来越多。因此,利用过程历史数据建立模型,研究正常工况下和已知故障发生时的统计学规律,进而实现对当前过程的监测及故障诊断,已成为了故障监测与诊断技术的一个研究热点,在这种情况下基于多元统计理论的过程