论文部分内容阅读
数字图像处理的概念是计算机科学的主要部分之一。图像处理已涉及到当今社会许多领域,例如医学,安全,技术,娱乐和媒体。对于安全性问题,尤其是关于交通和道路安全,对车辆的跟踪并在发生道路交通事故,超速行驶,违反交通规则等情况时,能够识别它们非常重要。这就要通过精确识别车辆牌照编号来实现。这是识别车辆的有效方法。此过程需要使用各种车牌数字图像。因此,用于对象检测和识别、分析和计算机视觉的算法出现了。其中一些算法是基于边缘检测的概念。边缘检测是图像处理算法的重要部分之一,具有许多的应用,例如图像变形,图案识别,图像分割和图像提取等。由于边缘是任何图像的主要信息之一,因此边缘检测是许多图像处理算法中非常重要的一步。它代表图像的轮廓,有助于将图像识别为具有检测到的边缘的对象。在理想情况下,通过将边缘检测器应用于图像,可以得到形成对象轮廓的不同边缘。边缘检测的重要属性是检测精确边缘以及图像中对对象的精准定位。并且,图像边缘的所有信息都包含对象的形状和方向的信息,其存储花销也比整个图像要少。许多研究人员提出了各种各样的边缘检测算法,并且根据所使用的导数的阶数将它们主要分为两种类型:基于梯度或基于拉普拉斯的算法。诸如Sobel,Laplacian之类的各种边缘检测算法无法满足低面积和减少延迟的要求。作为一种传统的边缘检测算法,Canny得到了广泛的应用和改进。在当前的边缘检测算法中,Canny边缘检测器是多年来的标准边缘检测算法。获取图像信息是图像处理的主要目标,并且在过去30年中越来越受欢迎。图像由不同场景的信息组成,例如场景中存在的不同对象的大小,颜色,方向。有趣的是,首先将对象与背景分离,然后必须检测所有边缘以获取对象的轮廓。因此,边缘检测在计算机视觉和图像处理中变得很重要。Canny Edge检测算法采用滞后阈值,阈值的不同对检测结果影响较大,但数量不能直观地反映检测结果。Canny Edge Detection算法提供了简单的边缘检测操作,从而减少了时间和内存消耗,是进行图像边缘检测是一种特殊的算法。在本文中,我们提出的方法使用Canny边缘检测算法对图像中的车牌进行定位,并结合一些用于车牌识别的过滤方法,通过光学字符识别系统进行字符识别和提取。该方法分为三个主要阶段:首先,检测和提取ROI(兴趣区域),在此阶段,将呈现特定于文本区域的特征的图像某些区域定位,然后从图像中提取出来,以便进行更深入的分析。使用性能很好的Canny边缘检测算法可以完成此过程。其次,识别车牌区域:先前提取的所有区域可能不是文本区域,甚至不是车牌区域。因此,这些区域需要经过多次过滤,以挑选出唯一包含车牌的区域。最后,在光学字符识别阶段,我们使用tesseract-OCR引擎在输出文本文件中识别和提取车牌字符。值得注意的是,必须先创建映像,然后才可以开始该过程。图像通常由相机捕获。摄像机通常在高速公路的入口或出口处,以捕获车辆图片,确保捕获包含牌照的区域,即所捕获图像的主要焦点。图片必须具有良好的质量,否则光学字符识别软件可能无法从图像中提取字符。兴趣区域的检测和提取过程首先基于印在车牌上的字符,通过分析得出以下结论:较大尺寸的图像需要在计算单元上花费更多的处理时间;车牌字符通常设计为易于定位并可以远距离读取的样式。这些是高发生率和高密度特征区域。车牌周围通常还具有很高的对比度,例如汽车的品牌,尾灯。对于基于车牌上的字符的检测,第一步是预处理步骤。我们限制了图像的大小,以使其长边达到440像素,保障其高/宽比。因此,我们最多需要处理440×440像素,或者原始图像需要193,600像素。在此新图像上,每次都会添加一些直方图均衡操作,以增加对比度增强功能和礼帽操作。这些可以产生更清晰,更准确的图像,尤其是具有更高的对比度。为了文本区域的定位或检测,需要执行一些操作。首先,我们知道要定位的车牌为矩形,并占据了图像的很大一部分。但是,标记的原理是为各个连接的组件分配一个与其表面成比例的值。我们发现,我们试图检测的车牌的可读性受该算法步骤的影响。我们试图通过歧视性测试做出不同的选择来解决这一问题。车牌通常在图像宽度方向上比其高度方向上占据更多的空间。除了选择表面之外,我们还使用围绕元素的矩形块的高度标准。因此,在我们的方法中,具有最高高度的连接元素,如门窗轮廓、墙壁图案、树木等,都会被衰减,而那些没有高度的连接元素,特别是我们所寻找的车牌,则保持完好。对于字符的分组,我们使用正方形但大小不同的结构元素。确实,经过几次实验,我们发现结构元素的大小应随着图像中车牌的大小而变化。此大小可能会因汽车距相机镜头的距离或捕获工具的放大倍率而异。为了克服这个问题,我们根据捕获的距离确定了三个不同大小的结构元素。对于小于一米的图像,没有放大,我们绘制了一个十二(12)大小的结构元素。对于在不到六米的距离处捕获的图像,使用大小为八(8)的正方形结构元素。为了提取先前检测到的区域,我们首先依靠在上一步中计算的边界框或边界框。然而,为初始图像选择的尺寸并不总是能够获得用于读取车牌的高质量图像。因此,我们最初使用缩小尺寸的图像来定位车牌,但是一旦将其定位,我们将使用比缩小后的图像大7倍的图像来提取它。因此,我们获得了更大,更详细的兴趣区域。为了将字符与图像背景分开,我们根据Otsu方法执行阈值处理。它具有自动确定最佳值的优势,因此达到的阈值可将图像中不同类别的分量分开。其次,对于车牌轮廓的检测,我们进行了一些操作。第一个操作基于Canny边缘检测算法,该算法旨在绘制图片上存在的任何对象的边缘,我们称作车牌区域。由于该算法基于灰度图像,所以处理的第一步是将图像转换为灰度。Canny边缘检测算法由4个步骤组成:降噪;梯度计算;双重门槛;磁滞现象的边缘跟踪。对于降噪,由于涉及到的数学主要基于导数(梯度计算),因此边缘检测结果对图像噪声高度敏感。消除图像上噪点的一种方法是应用高斯模糊对其进行平滑处理。为此,将图像卷积技术应用于高斯核(3x3、5x5、7x7等)。内核大小取决于预期的模糊效果。内核越小,模糊的可见性越小。在我们的示例中,我们将使用5 x 5高斯核。梯度计算步骤通过使用边缘检测算法计算图像的梯度,来检测边缘强度和方向。为了检测边缘对应于像素强度的变化,最简单的方法是应用突出显示两个方向上的强度变化的滤镜:水平(x)和垂直(y)。当图像平滑时,计算导数Ix和Iy wrt x和y。我们基于Otsu阈值算法执行了阈值,以便从背景中分割前景。磁滞机制可以帮助我们通过将弱像素转换为强像素来识别那些可以视为强像素的条件,前提是当且仅当被处理像素周围的至少一个像素是强像素。经过所有这些预处理方法后,我们可以获得经过处理的图像,该图像经过更多处理(例如,闭合轮廓填充和某些形态学开口)来执行,分离出过于紧密的元素。ROI是在此过程中填充的区域。通过使用连接的组件的标记算法从图像中提取它们。接下来是使用过滤方法识别车牌区域。为车牌区域定位执行了六个主要过滤器。我们首先使用Otsu阈值来识别前景和背景,以固定颜色。此阈值将图像分为两类。我们为背景分配较大的一个,为前景分配较小的一个。识别后,我们将白色固定为前景色,将黑色固定为背景色。固定这些颜色后,我们将使用大小为3×3的平方结构元素进行封闭。我们的目标是封闭所有可能成为图像瑕疵来源的孔。第一个过滤器消除了不能成为车牌特征的组件。我们在ROI图像中寻找所有连接的组件。在整理出图像区域之后,我们将每个连接的组件的面积与先前获得的新面积进行比较。较大的连接组件将被丢弃,其他保留。第二个过滤器基于这样一个事实,即即使一个盘子被截断,它也必须至少包含四个字符。因此,在先前的滤镜之后,它可以系统地消除包含少于四个连接成分的图像。第三个过滤器消除了所连接的组件,该组件比宽度高,车牌的字符都比宽度高,因此选择的阈值为0.8。该值是根据数块板的处理结果获得的。第四个过滤器旨在验证所连接的组件是否具有基本相同的高度。为此,将连接时间最长的组件作为参考。然后,我们验证所有其他连接的组件的高度至少是参考高度的一半。不符合此条件的任何人都将被拒绝。第五个过滤器确保图像中的字符数不少于4个,不超过9个。任何元素不符合此条件的图像都将从候选列表中删除。最后一个过滤器基于可用字符托盘的数量。所有这些级别的过滤器使我们能够在字符提取步骤完成(这是我们工作的最后阶段)之前,显著减少带有有害元素的错误ROI的数量。本文提出了一种车牌识别系统的实现方法,用以检测图像中的特定区域,描述从任何图像文件(jpeg/png)中提取文本所需的各个步骤,并创建了一个包含从中提取信息的单独文本文件图像文件。它研究了可用的各种图像处理应用程序的缺点,并通过执行可变级别的图像处理和过滤来克服这些缺点。使用Python语言的OpenCV库用于图像处理,而Tessaract-OCR用于字符识别。可变级别的图像处理可确保不同的图像获得不同处理级别的最佳文本结果。测试结果表明,该方法成功地从大多数测试图像中识别并提取了字符。通过我们的车牌检测方法,召回率为86%,准确度为87%。车牌字符识别成功率接近97%。