基于SOM的视频中人工文本检测方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:liongliong447
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的人工文本是表达视频语义信息的重要手段之一,对它的有效检测、定位与提取对于视频的分析理解和检索等应用都具有十分重要的意义。论文在对现有文本检测方法的研究基础上,针对大多数文本检测方法受到文本位置与语种的限制问题,给出一种视频中非限定性人工文本区域的检测方法。首先,重点研究SOM神经网络的特点,提出一种基于有导师学习的SOM神经网络分类器,从而使SOM在文本检测中能够对分类后的像素进行分类标记。其次,根据视频中人工文本区域存在强烈边缘的特点,采用Sobel边缘检测算子提取图像的边缘特征,提取出的特征作为特征向量的一部分。因为视频中人工文本区域与背景存在着明显的边缘,而Sobel算子不但具有方向性并且它检测到的边缘一般大于两个像素,能较好地描述图像边缘特征。然后,针对人工文本区域出现位置不同的问题,结合分类器的结构,给出区分人工文本区域与背景的特征向量的基本形式,利用有导师SOM分类器初步定位目标文本区域。最后,采用基于形态学的方法对目标文本区域进行处理,用以处理由于分类器的误判而出现的一些噪声点和空洞,并对精确定位的目标文本区域进行后期处理。实验表明,论文给出的方法能够有效检测并定位视频中的非限定性文本区域。
其他文献
当前的Internet寻址转发体系唯一地根据目的IP地址转发数据包,大多数情况下转发过程并不检查源IP地址。这使得恶意主机很容易伪造源IP地址。因此,阻止伪造的源地址并追溯发送
随着P2P网络在人们生活中的广泛应用,P2P网络管理技术成为了目前P2P研究中的热点问题。P2P系统中资源定位机制技术则是P2P管理中的关键技术。P2P网络资源定位技术涉及到节点
学习与记忆的认知能力一直是认知神经科学领域的热点问题。传统的关于数学学习与记忆的认知能力的研究主要集中在数字计算和数字处理上,已获得比较深入的认识。2004年,Poggio等
学位
在飞速发展的现代社会中,人们对发展智能交通的需求日益强烈。随着GIS(GeographicInformation System)技术和数据采集技术的发展,数据量越来越大,已拥有了庞大的空间交通数据,其
移动Ad Hoc网络是一种无基础设施支持的无线网络。与普通的无线网络相比,它具有分布式控制、网络自组织、动态拓扑、带宽有限、能量有限、多跳路由等特点。这些特点决定了MANE
随着互联网技术的发展,计算机网络越来越多地渗透到社会生活的各个领域,影响着我们生活的方方面面。然而,各种各样的网络安全问题也随之而来,网络攻击日益增多,信息安全事件频繁发
随着信息技术的发展,各个行业都建立起了基于网络的,分布式业务信息管理系统,并且应用范围越来越广。在日益频繁的数据传输和数据交换活动中,如何保证数据在传输与交换过程中
伴随互联网的高速发展,网络上的各种信息汇聚到一起,用户很难从大量的信息中搜索到所需的信息。搜索引擎能够根据用户输入的关键字进行搜索,减少用户查找时间。但是,搜索引擎
随着图像识别技术和基于内容图像检索技术的深入发展,自动图像标注技术受到了空前的关注,并渐渐成为了图像处理和模式识别领域里的一项重要的研究课题。自动图像标注方法的提
开放网络环境中存在大量异构节点,它们动态地自组织成不同的自治域。即使在一个自治域内部,由于节点的频繁迁徙,节点之间仍是相对陌生的。所以如何在陌生节点之间建立信任关系,是