【摘 要】
:
字幕是视频中的重要内容信息,它不仅包含了丰富的高层语义,而且经常用来对视频进行标注,是辅助理解视频内容的重要线索。所以对视频中字幕的提取和检索无疑是视频分析中的关
论文部分内容阅读
字幕是视频中的重要内容信息,它不仅包含了丰富的高层语义,而且经常用来对视频进行标注,是辅助理解视频内容的重要线索。所以对视频中字幕的提取和检索无疑是视频分析中的关键内容。其中,如何把字幕从复杂多变的视频背景中分割出来,让后续的OCR识别模块能够正确识别,一直是视频处理的重要内容,而这也是本文主要解决的问题。通过对前人的相关工作进行学习与分析,针对视频字幕中背景复杂、全局干扰强等问题,本文提出了一种基于字符切分和无监督聚类的视频字幕提取方法。该方法首先利用字幕图像的梯度特征对其进行字符切分,克服了字符间相互干扰与全局噪声的问题;随后,再根据颜色和位置信息,对每个字符图像进行聚类,尽可能地分离出字幕图层;最后,利用连通域分析等方法,减少了干扰噪声,得到清晰的待识别二值化图像。实验结果表明,本文提出的方法可有效地去除文字区域的背景内容,得到清晰的文字轮廓,从而提高字幕图像送入OCR之后的识别率,并且本方法在新闻视频字幕检测系统中也得到了成功运用,使整个系统能够完整地实现从视频中提取文本的工作流程,具有较强的鲁棒性。
其他文献
传统的交换网络将所有的业务和控制能力集中在交换机上,导致新业务的提供需要较长的周期,且仅提供简单业务无法产生足够的收益,于是,业务需求促使了下一代网络(NGN)的出现。
随着展馆管理的信息化、自动化及安全级别等的不断提高,传统管理方式中使用人工监控及采集数据的方式已越来越无法满足需求。传统的展馆管理方式无法实现对参观者及展馆情况
视频运动目标检测与跟踪技术是随着数字视频技术的发展而产生的一个新的研究课题,在国防安全、民用事业等领域有着广泛应用。粒子滤波算法本身适用于非线性非高斯动态模型,更
CRM (Customer Relationship Management客户管理),是在企业电子商务中流行起来的概念。通过构建CRM系统,企业基于对客户详细资料的深入分析,来提高客户满意度与销售业绩,从
Internet作为一个典型的复杂网络实例,对其宏观拓扑结构的特征分析是目前研究的主要内容和热点问题,受到了学术界的广泛关注。近年来人们在该领域的研究取得了长足的进展,但
云计算是一种全新的IT服务模式,向大量用户透明地提供按需、弹性、高效用的多租户服务。云计算凭借其超大规模存储能力、超大规模分布式并行计算能力、较高的可靠性和可用性
随着全球能源的日益短缺和温室效应的不断加剧,国际社会对节能的要求已经深入到人们生活的各个领域。近年来,由于网络技术不断进步,各类应用需求迅速增长,网络设备的规模和复
本文主要描述了基于关系-XML双引擎数据库管理系统CoSQLRX的XML数据索引的研究与实现。双引擎数据库系统是指能同时处理关系型数据和XML类型数据的数据库系统。随着XML相关技