运动图像中的文字识取研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:man416784150
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中通常包含大量的文字和图像信息,其中文字信息可以帮助人们更好的理解图像内容。利用计算机自动检测并识别自然场景图像中的文本信息,是模式识别和计算机视觉中重要的研究内容,相关技术可以应用到多种实际环境,例如车牌识别、汽车导航、文档检索、帮助视力受损者或者存在语言障碍的外国游客等。当前,OCR技术已经相对成熟,可以应用于提取和识别文档图像中的文本,但场景图像的背景复杂、字体的大小、样式、颜色、以及排布方向不固定,因此使用OCR进行场景图像文本的提取存在很多的困难。针对这些问题,本文结合场景图像中文字的相关特征,提出一种解决方法,可以有效的提取复杂场景图像中的文本。本文中,具体的研究内容包括:(1)、基于边缘特征的文字检测方法,用来初步确定场景图像的文本区域;(2)、根据场景图像中文字的灰度特征,对定位到的区域进行灰度检测,来确定文本域中的具体字符;(3)、对基于边缘检测和灰度检测所获取的区域进行融合运算,将距离及大小相近的连通域融合到一起。目标连通域中有一些纹理特征与文本域相似的噪声区域,使用筛选算法去掉噪声区域。本文提出的文本检测方法可以应用于多种环境中,既能够处理室外场景图像,也可以提取室内图像中的场景文本及人工文本。从实际环境中采集大量的图像,构造一个测试数据集合,并使用本文中的检测方法进行测试。实验结果表明,本文提出的文本检测方法具有较高的准确率,能够准确定位并分割出不同类型图像中的文字。
其他文献
随着互联网的发展,以电子商务为代表的新型的商业模式正在以凶猛的势头和难以置信的速度,加快传统商业模式的升级与改变。人们足不出户就可以进行商务活动和网上购物等,电子商务
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘可以从海量的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,能为管理者的决策提
随着网络中文档数量的与日俱增,人们的检索需求也在不断增加,数学表达式是大量网络文档的重要组成部分,人们经常会希望通过数学表达式在搜索引擎中检索所需的相关文档,但目前
目前随着互联网的蓬勃发展,尤其是电子商务的发展为越来越多的用户提供了Web服务。网民的选择增多,对网络服务的需求趋于理性和多样化,这为Web挖掘的发展提供了现实基础。对
战术Ad Hoc网络是Ad Hoc网络在战场指挥通信领域的一个典型应用,它具有节点分布区域广、作战需求强等特点,其移动模型技术是决定作战能力的关键技术之一。战术Ad Hoc网络中节点
特征选择是指从初始特征全集中,依据既定规则筛选出特征子集的过程。通过剔除冗余特征,以达到降低算法复杂度和提高算法性能的目的。特征选择是解决维数灾难问题的有效手段,
教学是学生与老师之间的互动,是教与学的有机结合,也是双方之间的绝对统一。这就需要教学当事人——老师和学生的积极参与、互动和交流,这不仅仅是将老师的教学活动与学生的知识
随着网络技术的不断进步、网络应用的不断增多,网络流量迅速爆发,对于服务质量、带宽计费以及入侵检测等网络管理而言,准确的流量分类变得更加重要。然而,在当前的网络环境下,由于
随着企业的逐渐壮大和信息技术的飞速发展,办公信息系统(Office Information System, OIS)已经成为提高企业办公效率的主要策略。即通过办公自动化来实现企业日常事务的办理,
智能车辆作为智能交通系统的重要研究内容之一,它是一个集环境感知、路径规划、决策控制等技术于一体的复杂系统。其中,决策控制技术占有重要地位,相当于人的大脑,现有的决策控制