视频文字信息的快速检测方法研究

来源 :中国航天第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:revire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,各行业在每一天都产生巨大的信息量,这些信息全部都以图像、视频等多媒体信息的形式被数字化,面对如此海量的视频和图像数据,人们需要从中迅速快捷地找到关键的信息,甄别信息的种类,快速找到满足自己需求特定视频或者图像,尤其在涉密机构内部,信息的类别也需要严格的甄别和划分,防止涉密的信息外泄。  本文针对大规模大容量视频数据库中文字提取方法做了深入的研究,针对视频库或者个人数据库中大量的视频文件或者图形文件,提出了一个能够快速提取视频中文字信息的方法。采用提取关键帧的方式对视频信息进行精简,在最大限度的保留视频信息的同时,删除视频信息冗余的帧,在获得关键帧之后,再采用文字检测算法进行文字的检测,本文采用基于最大稳定极值区域的方法来获得候选的文字区域,再通过聚类分析与证据积累得到最终的文字聚类,实验表明本文提出的针对视频文件的快速文字提取方法能够大大加快视频中文字检测速度,同时达到较高的文字检出率。  在关键帧提取方面,本文提出了一种基于最小视频内容单元的关键帧提取方法,通过两次镜头分割,将视频分成内容相对独立的视频单元,再从中提取关键帧。算法首先计算每一帧的颜色直方图特征矢量,根据相似度阈值对镜头进行分割;然后再根据镜头内容的变化程度将每个镜头分割成小的视频片段;最后再根据平均颜色直方特征提取关键帧。这种算法一方面可以根据镜头内视频内容变化程度调整关键帧的数量,另一方面通过划分最小视频内容单元使得关键帧具有很好的代表性,确保视频信息的完整性的同时又能够大大减小图像处理的数据量。  在文字检测方面,本文提出的基于最大稳定极值区域的文字提取方法。首先对提取到的关键帧进行最大稳定极值区域提取,获得具有极值稳定性的区域,然后根据文字特征,对所有极值区域进行多次聚类,再根据证据积累获得最终的聚类结果,通过两级级联分类器,利用文字的特征如孔洞数量,笔画宽度等将非文字区域排除,得到最终文字区域。基于最大稳定极值区域的文字提取算法具有良好的仿射不变性,对于方向或者形状发生变化的文字都能够很好的检测出来,使用证据积累的方法可以使得大大提高文字区域聚类准确度,对场景文字和人工文字的检测都有较好的效果。
其他文献
随着网络的发展,人类社会已经进入了信息化的时代,人们的生活和信息息息相关,因此信息安全也显得越来越重要。而保证信息安全的一个重要的手段就是密码技术。在密码技术中,密钥的
近年来,信号处理的理论与方法获得了迅速发展。事实证明,信号处理是推动众科学发展的一个重要基石。反卷积分析方法一直是信号处理研究中的一个热点,已经迅速成为该领域内重
猪传染性胸膜肺炎(porcine contagious pleuropneumonia,PCP)是由胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae,APP)引起的猪的一种高度传染性呼吸道疾病。本研究利用噬菌体
该文对并行多通道C/A码GPS接收机研制过程中遇到的一些理论和实际问题进行了研究,完成了信号捕获与跟踪、同步量测及抗外界干扰等技术的有关理论分析与仿真,并给出了具体的解
据世界卫生组织(WHO)报道,全球适龄里面有大约15%正在遭受不育不孕症的困扰[1],而我国的调查报告显示,约有10%的已婚夫妇患有不孕不育症,也就是说平均每6对夫妇中就有一对没
实孔径辐射计通过实孔径天线波束对视场进行二维机械扫描测量视场亮温分布并形成微波辐射图像,图像分辨率受天线物理孔径的制约。将辐射计与孔径综合技术相结合,缓解了实孔径天
离子敏场效应晶体管(Ion-Sensitive Field Effect Transistor,ISFET)具有良好的离子敏感性,能将电化学信息转换为电信号,是重要传感器件之一。基于ISFET的检测系统可以用于对离子
本文研究了复杂背景下基于单目视觉的静态手势识别,对识别过程中涉及到的主要问题提出了解决方法,提出并实现了三种基于手势边缘象素点的识别算法,通过实验验证了上述解决方
干涉合成孔径雷达(InSAR)成像技术是目前雷达和遥感领域的一个研究热点,是获取数字高程模型(DEM)十分有效的方法,在国防、经济和科学研究中具有非常重要的价值,因而近年来获
正交频分复用(OFDM)是一种无线环境下的多载波调制技术,近几年来,由于硬件技术的飞速发展和OFDM技术本身所具有的较好的抗多径衰落、频谱利用率高等优点,使其得到了广泛的关