图像文字定位与提取技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yqmaidou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术以及网络技术的快速发展,多媒体已经成为信息承载与共享的重要途径,数字图像文字识别技术作为当前图像信息检索与分析的重要环节,在机器人视觉、车牌识别、网络过滤、票据自动实时处理等领域中得到了广泛应用,是当前计算机图像处理技术中的重要发展领域。本文通过对传统的图像文字识别相关技术与理论进行整理与分析,对现有的图像文字的定位与提取技术的优缺点进行比较研究,针对其中存在的问题进行改进,包括定位效果不佳、处理过程效率较低等,并对改进后的算法进行软件流程设计,在Matlab 5.0环境下对改进后的新算法进行验证与分析。首先,本文在理论研究方面主要分析了颜色空间模型理论、数字图像处理相关技术以及图像文字识别的基本流程与技术难点;其次,在理论分析的基础上对现有的图像文字定位技术进行整理研究,分析各算法的优缺点,并在此基础上提出了改进后的图像文本定位算法,改进后的算法的主要处理步骤包括图像边缘检测、二值化处理、形态处理与噪声剔除等流程;第三,在对现有图像文字定位处理技术进行研究的基础上提出了一种新的图像文字提取与识别算法,新算法的主要处理流程包括文本倾斜校正、字符切分、归一化处理以及文本特征提取与识别等步骤。最后,在Matlab5.0环境下对改进后的文本区域定位算法和文字提取算法进行了上机仿真,根据算法的仿真分析结果可以得到本文提出的新算法基本能够应对常规应用环境下的数字图像文本识别需求。
其他文献
本文分析了目前常见的基于Linux的高可用性双机系统的实现的特点、技术手段和局限性,研究了心跳检测、成员籍管理、可靠通信和多播等关键技术,设计了一个新的Linux高可用性双机
特征降维是模式识别领域对高维数据分析的重要预处理步骤之一。在信息时代的科学研究中,不可避免的会遇到大量的高维数据,如人脸检测与识别、文本分类和微阵列数据基因选择等。
eMule作为当今世界最流行的P2P文件共享系统,拥有数以千万计的用户,同时在线客户端有数百万,共享了数以亿万计的文件资源,才外,eMule系统除了支持传统的eDonkey网络外,还加入
微博是目前十分热门的一种社交网络工具。人们越来越倾向于通过微博分享自己的所见所闻以及对热门事件发表评论等,这些评论通常包含了评论者丰富的情感,表明评论者的观点。通
众所周知,人类通过视觉获取的信息量约占总信息量的70%,而且视频信息具有直观性、可信性等一系列优点。近年来,随着网络技术、多媒体技术、通信技术的快速发展,网络视频技术
随着电子商务的发展和应用,人工智能、web技术和商务模型的集成研究成为一个前沿问题。电子商务网站在为顾客提供越来越多产品或服务信息的同时,也加大了顾客在海量信息中,准
随着网络规模和性能的迅速增长,网络安全变得越来越重要,传统的边界防火墙是保障网络安全的重要手段,但是它存在防外不防内、容易被绕过、易出现网络瓶颈等缺陷。嵌入式防火
多通道交互技术利用人的多个感知通道和控制行为的并行性,扩展了输入输出的带宽,提高了交互的自然性和灵活性。本文对多通道交互技术在教学中的应用进行了研究和探索,提出了
图像插值是数字图像处理中一项重要技术。传统插值算法模型简单,容易实现,它们原理基本相同,即需要找到与输出图像相对应的输入图像点,然后再通过计算该点附近某一像素集合的
在医疗急救系统中,急救车的调度和导航至关重要,建立一个快速而高效的急救车调度导航系统,尽快地将病人送到最近、最合适的医院抢救,并尽可能减少中间环节耽搁的时间,对挽救病人的