视频广告文本提取算法的研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:wangjuekenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和多媒体技术的发展以及智能终端的普及,录制各种各样的视频广告并将其投放在网络上传播变得越来越容易,视频广告已经成为当今社会最流行的商业媒介,已经成为公司提升品牌认知度的重要手段。视频广告中的文本主要包括广告商品的名称,商品的生产地,及对商品功能等的说明,是广告视频内容的高度概括,能够充分表现视频内容,因此视频广告文本提取技术对广告视频数据的管理有重要意义。而且视频广告文本提取技术研究可以帮助监管部门自动检测和过滤广告中敏感词汇,保障广告行业健康有序发展。为了能够吸引观众的眼球,视频广告中的文本在字体,排列方式,颜色设计等方面变化多样,表现形式非常复杂。与其他文本提取技术相比,从广告视频中提取文本更具有挑战性。本文主要对现有文本定位,分割和识别技术进行了详细研究,并分析了它们的优势和不足,提出适用于广告视频中文本的定位,分割和识别方法。针对文本定位,采用由粗到细分两阶段的定位方法。首先利用图像的边缘特征和连通区域分析完成文本的粗定位。然后,在有标签协同数据集,利用基于小波分解的频域特征和灰度共生矩阵特征用Co-training算法训练支持向量机,用训练得到的支持向量机完成文本的细定位。基于有标签协同数据集的Co-training算法解决了传统Co-training训练方法容易向训练数据集引入错误分类样本的问题。由于没有公开的视频广告数据集,本文从网络中收集广告文本图像集。针对文本分割,本文采用一种自动种子算法,并将这个算法应用到迭代图割算法中,完成文本的分割。针对文本识别,本文对卷积网络的结构进行了详细的研究和分析,采用了基于卷积神经网络的文本识别程序的思想。在LeNet-5网络模型的基础上,设计了适用于广告视频文本识别的网络结构。为了中文的识别,利用文字生成器,建立文本图片训练数据集,用于学习网络结构。
其他文献
TCP是目前Internet中使用最广泛的端到端传输协议。近年来出现了许多新TCP拥塞控制算法,如慢启动,拥塞避免,快速重传和快速恢复,大大提高了网络传输的性能。由于密集波分复用
软件逆向工程技术的不断发展,带来了程序分析方法的不断进步。程序分析有助于人们理解软件构成,解决软件漏洞查找以及进行程序细节分析等。但是程序分析技术[1]也是一把双刃
近年来面向对象技术成为主流的软件开发方法。随着软件规模逐渐扩大,但软件的成本和进度也越来越难于把握和控制。软件估算技术提供了一种定量化的方法以控制软件开发过程,它帮
生物免疫系统是一种复杂的自适应系统,该系统能有效地使用多种机制防御外部病原体入侵。具体表现为免疫记忆、抗体的自我识别能力和免疫多样性的优点。同时生物免疫系统在运
Excel具有强大的数据表现能力和处理能力,以及它极低的使用成本和良好的易用性,使得Excel在中小型企业信息化过程中产生极其重要的作用,同时也使得目前绝大多数应用系统都离
随着自动化水平的不断提高,人们对于设备维修的认识水平也在提高。大型旋转设备是现代大规模生产装置的关键设备,要求长周期连续运行,在这种情况下,如果只对机器采用事后维修则会
影响力传播的最大化问题的目标是在网络中寻找影响力最大的K个点,使得从这K个点传播出的影响力(如信息、想法、观点等)期望影响到的节点数是最大的。该问题是社交网络的基础
预测是科学管理的重要环节,是决策、规划的前提。在社会经济管理中,经常要对某一事物或系统的发展趋势进行预测和分析。时间序列预测是预测领域内的一个重要研究方向,它是一种根
网络信息的飞速膨胀带来了“信息爆炸”问题,快速准确的从中获取用户所需要的信息,成为一个急需解决的问题。信息过滤(Information Filtering,IF)技术可以帮助人们检出感兴趣
随着人工神经网络系统理论的发展,神经网络技术日益成为模式分类的有效手段。神经网络的学习方式包括监督学习和非监督学习。非监督学习算法的分类精度通常很难令人满意,而监