基于笔画内容的视频检索方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:wuheli0811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,数码产品的普及以及存储器容量的提升,视频数据量呈现出指数级增长,如何对海量视频数据进行有效的检索已经成为一个亟待解决的问题,于是基于内容的视频检索就成为了当前多媒体领域的研究热点。   本文在综合分析已有基于内容的视频检索方法的基础上,提出基于条件笔画密度提取的文本定位方法,基于蚁群与K-均值聚类相结合的文本分割方法和一种基于多模板字符匹配与BP神经网络相结合的字符识别方法,并设计实现相应的原型系统。具体内容如下:   (1)把条件密度引入到笔画提取中,提出基于条件笔画密度提取的文本定位方法。该方法首先根据文本笔画的特征对视频图像中的文本进行初步定位,然后用基于条件密度的方法滤除一部分非文本区域,最后再利用动态形态学对提取的文本区域精确定位和进行优化得到最终的文本区域。该方法能滤除大部分非文本信息,得到相对精确的文本区域,并且定位效果较好。   (2)针对当前视频中文本区域分辨率较低且受光照影响较大的问题,为了在提高文本图像精度的同时减少光照对文本图像的影响,提出一种基于蚁群与K-均值聚类相结合的文本分割方法。该方法充分发挥蚁群算法的全局优化特征和K-均值算法的局部寻优能力,克服K-均值聚类算法易受孤立点影响的缺点,利用两种方法可以优缺互补的特性,对视频图像进行文本分割,取得了较好的分割效果。   (3)提出一种基于多模板字符匹配与BP神经网络相结合的字符识别方法,先建立字符模板库,不仅考虑字号大小,而且还结合了不同字体混排的现象,来扩充模板库;然后通过BP神经网络对由字符分割得到的字符进行训练识别并输出,最后采用字符区域分割匹配的方法与字符模板库进行匹配,得到识别结果。该方法充分利用了两种方法的优势,使实验结果较好。   (4)采用面向对象的思想设计并开发基于笔画内容的视频检索原型系统。该系统包括文本检测、文本定位、文本分割、字符识别等功能模块。并通过实验对比验证上述方法的有效性。  
其他文献
物以类聚,人以群分。今天,面对互联网上日益增长的数据,聚类在数字图像处理、物种类别分析、网络社区发现、信息安全监测、企业商务智能决策和文本数据挖掘等领域得到了越来
通用游戏是人工智能最具挑战性研究领域之一。近年来得到快速的发展,在军事行动、电子商务、商业流程管理等方面有巨大实用价值。通用游戏的目的在于设计一个只接收游戏的游
灾害性天气的预报和警示在人们的生产、生活中具有举足轻重的地位。天气的历史数据和预报员的经验往往对气象预测的结果起着重要作用,通常预报员可以根据当前的天气情况和历
随着数字化信息时代的到来,越来越多的数字化产品普及到了人们的日常生活。虽然数字化技术对信息的处理、传播和复制了提供极大的便利,但同时它也带来了一些负面效果,如版权
在传统的TCP/IP协议中,IP地址同时表示节点身份与位置,存在语义过载问题,导致核心路由表扩张,移动性差,多宿主等诸多问题,基于位置/标识分离思想是解决该问题的方式之一。但
随着计算机技术、数据存储技术和数据库技术等飞速发展,特别是互联网技术的广泛应用,个人电脑和互联网服务器上每天都会出现海量数据。从这些数据中挖掘出有价值的信息以指导
随着水资源的日益紧缺和农业机械化的要求,微灌已成为精确农业的一个重要组成部分。由于无线传感器网络(WSN)在许多场合的成功应用,国外已经将WSN技术应用于大范围农业微灌控
智能规划是近几年人工智能领域中的一个研究热点,因其广泛的应用价值和在理论研究中的重要地位,受到越来越多的学者关注。马尔可夫决策过程是研究随机环境下多阶段决策过程优
在软件开发过程中,软件需求扮演着极其重要的角色,能否满足软件用户或者市场的需要成为了软件能否取得成功的关键因素。传统的软件需求工程中,软件需求工程师协调着软件需求
当前网络安全问题日益突出,网络与信息安全面临严峻的挑战。传统的安全系统主要由防火墙、筑高墙、防外攻等手段组成,其不能从根本上解决网络安全问题。而大多数的安全问题是