基于角点的新闻视频字幕提取研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:zx1112220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过新闻视频节目获取信息是现代社会人们日常生活的一种非常重要的方式。在基于视频内容分类检索中,准确的新闻视频标题定位和提取在检索过程中起着极其重要的作用,因此它已成为多媒体信息处理领域重要的研究方向。然而新闻视频的分辨率较低,并且经常嵌入在复杂的背景中,这给文本定位和抽取造成了极大的困难。接下来着重研究复杂背景下的新闻视频中文本定位和抽取的问题,提出了一种基于角点的新闻视频字幕提取方法,下面是具体的步骤:一是针对当前的基于角点定位算法易产生虚警率的问题,提出了一种基于角点的多层过滤机制从而逐层降低基于角点的文本定位的虚警率。在整个字幕定位过程中,所有定位算法都是基于角点,因为角点能够准确的描述视频中文字的特征,且不同的对比度下具有不变性的特点。首先检测出视频帧中的角点,然后再利用角点多层过滤机制能够精确定位复杂背景下的文本行,即先通过角点聚类去除孤立角点,减少噪声对下一步文本行定位的影响;再通过角点水平投影过滤掉不符合文本行特征的角点,得到候选文本行图像;最后通过水平滑动窗口过滤掉文本行的残留背景区域或者伪文本行,得到最终的文本行图像。二是针对当前文本抽取算法不能够很好的完成不同对比度复杂背景下的图像二值化问题,提出了极性判断+二次二值化的文本抽取算法。首先采用新颖的极性判断算法判断文本行中文字的极性,该极性判断算法经过大量实验验证和统计,算法极为可靠,同时具有很高的准确率。然后在第一次二值化的时候,根据极性判断结果,自动调整第一次二值化的阈值,再然后通过局部二值化进行第二次二值化,并根据极性判断修正局部二值化阈值,从而得到保留更多笔画细节的二值化图像。最后,把文本抽取后的文本行图像送入OCR(光学字符识别)插件中进行文字识别,本文采用开源的Tesseract-OCR。实验结果验证了本文提出的新闻视频字幕提取方法的可行性和有效性,即使在复杂程度很高的背景和环境下,该方法也具有较高的稳定性和准确率。
其他文献
目前的幼儿音乐教育中存在着对教学形式"动",在观念上,将音乐教育中的"动"与一般游戏的"动"无差别对待;在实践中,幼儿音乐教育追求幼儿表面的动觉参与。这些现象违背了音乐与
“在高等教育国际化的进程中,中外合作办学已成为重要的方式之一,西方国家也将跨越国境的高等教育作为国际化的重要输出方式。”①而近年来,这一新型的办学模式得到快速发展,
我国的电视读报栏目以2003年初凤凰卫视《有报天天读》栏目的开播为起点,迄今已有十多年的发展历史,它是中国电视媒介产业化深入发展的产物。电视读报栏目的诞生,一方面开拓
随着工业发展、人口激增、车流量增大,大气污染日益严重,人类健康和地球本身受到严重威胁,监测空气质量并采取合理的治理措施以实现控制同时减少污染物的排放成为现今社会关注的
“思想道德修养与法律基础”课(以下简称“基础”课)是思想政治理论课之一,而“基础”课的实践教学环节是其整个教学过程的重要组成部分,是深化课堂教学的有效途径,是大学生获取
以BaCO3和TiO2粉末为原料,采用固相反应法合成Ba2Ti9O20的粉体,并以此粉体为主要原料添加适量的分散剂、粘结剂及塑性剂,采用流延法制备Ba2Ti9O20陶瓷膜片。研究了不同种类和
电力市场改革的主要目标在于优化资源配置。而发展中国家电力市场改革往往需要经历一个较长的改革过渡期,该时期内电力市场受到能源政策、市场管制及其它相关因素的影响,难以
药物载体的研发已成为目前的研究热点。用来制备药物载体的材料主要为反应活性高、易于被功能化的合成型高分子,然而,此类载体大多存在安全性方面的不足。为解决这一问题,本
经国务院同意,由教育部和国家语言文字工作委员会组织实施的中国语言文字使用情况调查工作从现在起将在全国各省、自治区、直辖市陆续展开。1999年8月9日,这项调查的启动仪式在京举行
摘要:近年来,高校成了腐败案高发区和高危区,主要表现招考暗箱操作、学术运作腐败、楼堂建设招投标违规违法操作及教材、办公科研器材设备采购中的受贿等。在这种象牙塔内外腐