视频字幕检测与识别技术研究及系统实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:liujmjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频节目的字幕检测与识别是一个应用性很强的课题,构造高检测率、高识别率的检测识别系统是研究追求的目标。本文结合视频中字幕图像的特点探讨了相关问题。 在视频节目的字幕检测方面,提出了利用字幕时序信息粗定位,再利用字幕内外边缘模型精定位的字幕检测方法,充分利用了字幕图像多帧的特点。 在字幕图像的预处理方面,针对视频节目中字幕图像的背景变化丰富的特点,从实际应用出发,提出了一套快速有效的字幕图像预处理方法,消除了噪声和字幕背景复杂带来的影响。 在识别特征提取方面,借鉴前人对视觉原理及Gabor滤波器组的研究,探讨选取了符合字幕特点的Gabor滤波器组参数,通过适当的特征降维方法,提取出了区分能力较强的识别特征。 在字幕识别方面,借鉴目前较为成熟的印刷体字符识别技术,同时结合字幕识别问题的自身特点,对于隐马尔可夫模型应用于字幕识别进行了深入的探讨,同时结合统计语言模型进行字幕识别,极大地提高了识别率。通过实验充分证明了应用隐马尔可夫模型和统计语言模型进行字幕识别的优势和潜力。
其他文献
本文通过对荣华二采区10
期刊
智能视频监控可以智能地监控目标行为,检测非正常事件,有着重要的理论意义和应用价值。实用的监控系统,必须能够适应不同的场景、不同的光照条件,能够很好的处理室内、室外目标的
随着生物科技的进步,植物不仅可以为人类提供传统的天然产品,而且已成为表达有医药价值或工业用途的外源蛋白的良好生物反应器,利用植物生物反应器表达外源蛋白,可将外源蛋白富集
摘要:为全面掌握学生音乐学习的心理现状、特点及成因,从而有针对性地开展音乐教学。今年以来,我对全校22个班的800多名学生音乐学习心理进行了一次调查和研究。总的感到,学生喜欢音乐,对音乐具有浓厚的兴趣,并具备了一定的音乐认知、审美经验以及音乐鉴赏能力,他们参与音乐活动的指向性、目的性和自我意识较为明显。但由于音乐学科是副科,没有升学的竞争压力,学生的音乐兴趣和爱好、学习动力,往往很大程度取决于音乐
本文是对电力环境中仿真系统进行研究,并提出实现方法。电力环境仿真是以电信号为基础,仿真可能出现的各种电信号的现实电网环境;精确,高效地测试二次回路的继电保护及自动化装置
本文对现代基因技术安全问题的伦理进行了研究。文章在对基因技术研究和应用这些背景知识介绍的基础上,概括分析了基因技术的社会意义和引发的伦理论争,探讨了它对人类和生态环
美国陆地卫星7号(Landsat-7)于1999年4月15日由美国航天局(NASA)发射升空,其携带的主要传感器为增强型主题成像仪(ETM+)。2003年5月31日,Landsat-7 ETM4+机载扫描行校正器(Scan
转录因子具有结合DNA的能力,在生物发育过程中通过调控靶基因的表达发挥重要作用。对转录因子下游基因的鉴定能够很好地解释其功能。Apontic(Apt)是在果蝇中发现并在果蝇胚胎
J2EE作为企业软件的主力平台,技术已相当成熟,基于该平台的各层应用框架、中间件等产品也十分丰富。然而传统的基于多层框架的开发模式有一些不足之处:需要各层框架组合使用,配置
本文研究了两轮同轴自动平衡载人小车的原理及制作过程。所谓两轮同轴自动平衡载人小车是指使用者要双脚站在由两个轮子支撑的平板上,抓牢类似自行车的手柄,保持站立姿势,小车自