基于支持向量机的新闻视频主题式字幕提取

来源 :天津大学 | 被引量 : 0次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的蓬勃发展,人们每天都会获得大量的多媒体信息,如何有效而快速地检索、存储这些信息,给传统的数据检索以及数据存储技术提出了极大挑战。在多媒体数字视频中,新闻是一类具有特殊结构特性的视频数据,具有重要的应用和研究价值。其主题式字幕通常能够反映一整段新闻故事单元的主要语义内容,这不但对新闻视频分割提供了一个分段依据,更为新闻视频索引以及结构化存储提供了大量语义标签,因此在新闻视频检索领域字幕提取占有重要的地位。由于新闻视频中的字幕信息常常嵌在变化复杂的背景中,同时新闻视频必须经过数字化和有损压缩编码,使其重建图像分辨率有所下降,这均会干扰新闻视频中的字幕提取的准确性。本文通过分析了新闻字幕的纹理特征,提出一种新的特征组合,其可以有效地实现镜头切换帧中的文字块与非文字块的辨别。识别算法中共选取20个识别特征,其中包括四个不同偏移量下的灰度共生阵提取的对比度、相关以及熵共12个;由图像小波变换LH子带和HL子带提取系数方差和系数直方图方差共4个;边缘强度图中提取的四个方向的边缘强度比特征共4个。在分类器的选择上,本文通过比较多种分类算法,选择了SVM进行文字块与非文字块的分类,通过对特征和分类器的大量试验,结果表明从特征选择到分类器的选择都是合理而有效的。另一方面,考虑到各电视台通常选用不同的颜色区分主题式字幕与采访式字幕,本文提出一种基于K均值聚类的方法,通过计算各类与标准主题式字幕的颜色距离,进行这两类字幕的辨别。最后,运用了包括形态学滤波和投影直方图等后处理技术进行字幕区域的精确定位以及对字幕内容的增强,为后续的OCR字幕内容识别做好了基础。
其他文献
未来后三代或称第四代(B3G/4G)移动通信系统在传输速率、系统容量、业务功能和类型、服务质量和可靠性等方面提出了更高的要求。为满足技术需求,需采用分布式无线网络结构及跨
基于视频的人群异常状态检测能够为公共安防预警和聚集人群疏导提供有力的保障。如果我们能够有效地利用现有的资源使监控系统智能化,对群体性事件进行行为状态分析,判断是否
过去的三十年,人们见证了Internet与移动通信的飞速发展。计算机和互联网技术的发展让地球村不再是幻想,而移动通信的应用与普及则让人们对随时随地通信更加期待。基于IEEE 802
跳频扩频多址(FH-SSMA)通信系统由于其在频率分集和有效对抗远近效应方面的优势一直受到广泛关注,而同频道干扰(CCI)是限制其性能的主要因素。同频干扰消除算法能在接收端有效
随着数字多媒体信息技术的迅速发展,视频压缩技术对数字电视、可视电话、无线视频等视频通信服务中起着举足轻重的作用。现阶段用于视频压缩编码的最新标准有MPEG-4、H.264及
GIF图像是当前网络上非常流行的一种图片格式。对于这种图片的保护就显得非常重要,但是当前还没有一种很好的算法能同时实现对GIF图像的版权认证和完整性保护。针对以上情况,
利用1995年~2014年石油工业上中游投资数据对石油工业上中游投资进行协整分析,发现石油工业上游投资和中游投资之间存在长期的正向均衡关系,误差修正模型的结果表明石油工业
随着工业自动化的快速发展,动力传动系统在航天航空、舰船、核电、汽车等行业中发挥着至关重要的作用。现代传动设备高速化、自动化、复杂化和精密化的程度越来越高,一方面大大的提高了生产效率,另一方面对设备安全性的依赖也越来越强。机械传动设备中,通过齿轮耦合带动设备运行,由于材料、设计不合理等原因,齿轮用了一段时间可能会出现损伤或断裂,从而引发的重大灾难事故时有发生。对机械传动设备的齿轮形变规律的研究,有利
民用航空产业大发展使得传统民用航空通信系统容量逐步趋于饱和,建立一个空天地一体化的未来航空通信系统已是大势所趋。航空移动通信系统收发端飞行器处于运动状态,在三维立
本文在简要分析高校使命定位历史变迁规律的基础上,从现代市场营销理论视角分析经济新常态下目前我国高校使命定位问题,并指出其历史局限性,然后根据现代市场营销原则,结合经