【摘 要】
:
近年来,随着数字化技术、信息化技术以及多媒体技术的迅速发展,有大量的数字图像、遥感图像、广告图像、路标指示牌以及微博(web)中的图像充斥着我们的生活。而这些图像中包
论文部分内容阅读
近年来,随着数字化技术、信息化技术以及多媒体技术的迅速发展,有大量的数字图像、遥感图像、广告图像、路标指示牌以及微博(web)中的图像充斥着我们的生活。而这些图像中包含了丰富的语义信息,是智能控制系统和信息检测与检索系统的重要处理对象。提取和识别这些图片中的内容对于人们的日常生活和工作有很大的帮助,也减少了人工劳动的工作量。虽然国内图像分割与识别技术在学术与工业应用上取得了一定的成绩,但是在实际应用中,计算机对图像文本信息的识别和理解能力仍然达不到人们的要求。文字提取与识别主要包括文字区域的检测、文本区域的分割、文本的提取和文本的识别等,由于在彩色图像中一些图像本身的分辨率较低、背景比较复杂、亮度影响以及位置、形状与颜色具有不确定性等,针对彩色图像中文字提取与识别的上述问题,本文采用了一种基于K-means聚类和神经网络的方法。首先分析图像的特征,并利用图像分析、图像分割、图像增强等技术检测图像中的文字区域,然后将文字区域从彩色图像中分割出来,进行小波差值放大,再利用k-means方法对彩色图像聚类得到单背景彩色文字图像,进行二值化和文字切分处理,最后再利用神经网络对文字进行识别。实验验证,该方法在一定程度上可有效解决复杂背景图像中文字识别的问题。
其他文献
近几年来,智能移动终端和新一代移动网络的普及给视频应用提供了广阔的空间。但是,相对于日渐庞大的视频业务需求,网络资源是极其有限的。为此,学术界和产业界投入了大量的精力进
全过程游戏自动生成技术是中国科学院陆汝钤院士提出的一个构想,希望能够通过自然语言创建脚本,通过游戏脚本,添加游戏的元素最终生成一个游戏。基于游戏引擎的3D手机动画自动生
该文简要介绍了双波段红外火焰探测系统的主要设计依据,阐述了其基本工作原理,介绍了系统中与软件设计相关的硬件组成,尤其是双波段红外火焰探测器的硬件设计,并给出了控制器
关于安全博弈的研究近年来广受重视,许多基于安全博弈论的系统已在现实世界中得到了成功应用。在该研究的理论框架中,博弈双方为安保部门和不法分子。其中安保部门首先确定一种
本文的工作是为北京大学软件工程研究所正在研发的基于Erlang OTP(OpenTelecom Platform)的虚拟计算平台UniAS提供处理大文件数据的能力,设计并实现了大文件并发处理模块。本
随着网络规模的扩大和复杂性的增加,人们对集成系统和网络管理体系结构的要求越来越高.如何进行有效的网络管理,保证网络的良好运行已成为一个迫切需要解决的问题.目前的大多
三维编织技术是国外八十年代初发展起来的一种新型纺织技术.主要的两种编织方法:二步法和四步法.以往的三维编织多采用四步法进行,在这方面的织物结构研究和计算机辅助设计已
所谓“眼见为实”,通过观察一幅图像,人们可以对事物的外观信息和由其呈现出的事物性质得以直观和真切地把握。由于量子计算机的性能较之经典计算机有着本质的飞跃,以及量子计算
当前,回答集程序设计已经成为人工智能领域知识表示和推理的重要工具。它是一种描述性的问题解决框架,非常适用于对涉及常识推理的问题进行建模,并自动求解。动态逻辑程序是回答
由于互联网技术的快速发展,我们可以通过它来发布和获取各式各样的信息。所以,为了充分且有效地表示网络上丰富的数据,W3C组织提出了将XML作为互联网上信息共享的格式。XML由