复杂背景下视频字幕文字的提取与去除的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:ericlin1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和多媒体技术的广泛应用,以数字视频、图像为主的信息成为信息交换的主流媒体,极大地影响了人民的生活方式。视频图像中的字幕包含了丰富的语义信息,检测和定位这些信息,将为视频图像的理解和分析提供很大地帮助。同时,如果能有效去除图像中的字幕并恢复被字幕遮挡的背景区域,这对于视频的重复利用具有十分重要的意义。本文主要对复杂背景下视频图像中文字的提取以及文字区域的去除修复进行研究,主要工作包括以下几个方面:在文字提取方面,考虑文字的颜色和边缘特征,本文提出了一种基于彩色边缘检测及连通域特征分析的文字提取方法,有效地降低了文字和背景灰度值相近时的误检率,具有较高的正检率。同时,本文算法对于不同种类的文字检测具有较强的鲁棒性,适应性强。在图像修复方面,本文介绍了经典的Criminisi基于纹理合成的修复方法,分析该算法的结构及其存在的一些缺点,在此基础上提出了以下三点改进:(1)纹理模板块大小:根据图像的纹理分布情况,采用不同大小的模板块,即纹理信息丰富的区域采用较小模板,纹理信息弱的区域采用较大模板,有效保证图像纹理信息的同时提高了修复速度。(2)改进优先级计算:将优先级计算公式由原来的乘法运算变为加法运算,并且增加了数据项即结构信息的权重,有效降低了乘法对于零因子的敏感度地同时对于结构信息强的图像有较好的修复效果,相比纹理信息而言,人眼对于结构信息更为敏感,因此改进后的修复图像更符合人眼的视觉效果。(3)修改最佳匹配函数:考虑了局部相似性准则,在匹配函数计算时引入了距离的概念,有效地减少了误匹配的操作,保证了修复的准确性。本文对改进后的算法与经典Criminisi算法进行了大量地对比实验,实验结果表明本文算法在保持图像纹理和结构信息的同时具有较高地修复效率。
其他文献
本处理器的研制从器件入手,适应工业生产过程实际温度的情况,并详细地分析了影响测量精度关键器件的温度特性,分析器件的性能。针对工业生产温度测量信号输出信号小,并且感温元件
气力输送在电厂发电、高炉炼钢等工业领域的广泛应用使得众多学者专家致力于其输送过程的安全和稳定研究。管道固相颗粒的流动状态一定程度可反映气力输送过程的安全和稳定性
本论文针对目前生物杂交实验过程中还不能实现全自动化的现状,设计了基于智能控制技术和嵌入式操作系统的智能杂交实验仪。在实验温度控制上,详细研究了多种控制方案,包括模糊控制,先进PID 控制等,通过多次计算机仿真实验和实际试验选取了模糊控制+预补偿PID 的新型复合控制技术,实现了温度的精确控制;在软件开发时选用了成熟的源代码公开的μC/OS-II 实时嵌入式操作系统(RTOS)作为实时内核和Keil
増程式电动汽车是目前比较流行的一种电动汽车形式,作为新能源汽车的重要解决方案,得到了迅速发展,是近一阶段研究的热点。文章通过Cruise软件进行増程式电动汽车建模,以实现
进入信息时代,人们对信息的安全传输、安全存储、安全处理的要求越来越迫切。信息安全研究的内容很多,加密技术在网络中占有比较重要的地位。因而加密服务器的研究具有重要的
影响动物细胞培养的因素众多,生长因子、葡萄糖、谷氨酰胺等起着非常重要的作用。本文介绍了一种杂交淋巴瘤细胞非结构动力学模型,它考虑了赖氨酸作为限制性基质的作用。在动力
高超声速飞行器因其极快的速度、特殊的飞行高度,受到极大关注。高超声速飞行器的稳定控制算法设计是整体高超声速飞行项目中不可或缺的一环。针对高超声速飞行器飞行参考指
工业网络技术覆盖范围不断扩大,已实现将整个工厂的生产流程和控制系统统一到一个信息管理平台上。我们研究开发的 EIMS 是采用 PROFIBUS-DP现场总线技术,实现从现场智能设备
论文根据无人机、卫星等视景仿真任务需求,结合国内外视景仿真开发的研究现状,提出了基于OGRE图形引擎的视景平台总体方案。方案提出了视景平台的层次化组件化搭建思路,即首
嵌入式系统是一种具有特定功能的专用计算机系统,随着我国信息化进程的不断深入,高端嵌入式系统的应用将日益广泛。Linux凭借其开放源码、易于裁减、高稳定性和可靠性的优势,在