论文部分内容阅读
在讨论细节之前,我们仅仅在以下方面总结我们的工作:我们提出了一个基于人类视觉系统的增强彩色图像对比度的新方法。在该方法中我们将原始图像的任意片段的每个像素的RGB值转换到HSV值。然后用K均值图像分割技术将原始图像的V分量分成暗色和亮色部分。下一步我们对彩色图像的亮度值V分量采用小波变换来获得近似分量,它是通过采用基于人类视觉系统的灰度等级对比度增加技术来转换得到的。然后在转换后的系数上执行反小波变换来获得增强了的V值。饱和度分量通过直方图均衡化来增强。H分量没有变,因为H分量上的变化将降低HSV分量之间的色平衡。最后增强的S和V和H一起被转换回RGB值。通过把任意图像当作一个整体考虑它们的亮度或者低对比度然后把它们分割成暗和亮部分,我们的新方法已经有效的获得了任意彩色图像的成功的增强。通过合并小波变换和神经网络,我们同样获得了一个纹理分析和分类的优化方法。为了得到纹理识别的一个合适的途径,我们首先采用小波变换来分解纹理成子图,子图依次被分析最终提取出特征。神经网络使用提取出的特征来对不同类型的纹理分类。我们这里分析了五种类型的纹理,对每一种纹理使用了五幅不同的图像。我们已经获得了更多精确的结果。我们同样回顾了使用灰度值来把一副图像分成区域用来获得对图像的正确理解的主要方法。我们主要比较了具有使用边缘检测来做边界估计的基于区域的分类。当一条边可以被非正式的描述为一副图像中相邻部分之间的边界时,图像分割是许多图像处理和计算机视觉算法中重要的一步。一个正式的描述不那么好说,但无论如何边缘检测是一个有用而且无处不在的图像处理任务。比较后我们得到一个结论,边缘检测具有不需要闭合的边界的优点,同样它的计算是基于差异。而基于区域的分割尽管用多光谱图像来改进还是有仅仅应用在闭合边界上的不足。为了获得边缘检测的结果,我们已经使用了性能指标和canny边缘检测。我们采用Canny真实值通过显示更多细节来获取更多特征。进行细节讨论时,让我们开始简要解释我们选择这个主题的动机。主要动机是,使用颜色和纹理特征的图像增强和分析算法来改进和增强彩色图像。掌握分割彩色图像的所有方面,这也是在分析和理解一批彩色图像时所必需的。我们也提供了基于小波和神经网络对纹理的分析和分类。有时候图像不清晰,我们因而需要为后续的分析增强和调整它们。这个主题将会对我的国家在分析气象学图像,在警察部门分析人们的脸部数据以及在机场与邻国共享信息上非常有用。图像处理并不是一个那么新的方向,但它在多年来持续改进。当一副图像自身清楚可读时,对它做很好的理解和分析将变得容易些。因此对那些可见性或者外观不清楚的图像,我们需要改进并增强它们。前面已经提到,这个主题在当前具有全球安全性的趋势下的世界非常有用。伴随着改变了的世界和安全问题,我的国家喀麦隆和世界上其他国家一样需要掌握和处理日常生活中不同方面的图像。为了预测灾难和自然灾害,我们需要分析获得的卫星图像,这么做时我们需要子分图像为更小的部分,因为图像越小细节越显著更容易理解。一个良好的分析将有助于有效避免如洪水、地震等自然灾害。伴随着全世界的恐怖主义全球化趋势,当今图像处理的海量应用体现在安全性方面。对图像的良好分析将帮助侦测、定位和逮捕犯罪分子。国家之间可以共享最想要的犯罪分子的照片,一个建立良好的图像数据库将帮助跟踪在中非区域穿越边界的所有犯罪分子。用指纹数据我们可以提取出关于喀麦隆的所有国民的任何信息,同中非其他六国一样,正在建立一个单独和唯一的数据库和六国的唯一护照。中非六国是乍得共和国、中非共和国、加蓬共和国、赤道几内亚、刚果共和国和喀麦隆。这里展开我们的工作,我们提出了一个基于人类视觉系统增强对比度的新方法。在该方法中我们将原始图像的任意片段的每个像素的RGB值转换到HSV值。然后用K均值图像分割技术将原始图像的V分量分成暗色和亮色部分。下一步我们对彩色图像的亮度值V分量采用小波变换来获得合适的分量,它是通过采用基于人类视觉系统的灰度等级对比度增加技术来转换得到的。然后在转换后的系数上执行反小波变换来获得增强了的V值。饱和度分量通过直方图平均化来增强。H分量没有变,因为H分量上的变化将降低HSV分量之间的色平衡。最后增强的S和V和H一起被转换回RGB值。通过把任意图像当作一个整体考虑它们的亮度或者低对比度然后把它们分割成暗色和亮色部分,我们的新方法已经有效的获得了任意彩色图像的成功增强。我们提出的新方法的处理流程如下面十步所示:1.载入一幅彩色图像2.读两个片段之中任一的每个像素的(r,g,b)值3.转换两个片段的RGB颜色空间到HSV颜色空间4.对V分量采用K均值来分割彩色图为暗色和亮色部分5.在每个片段的S分量上采用饱和度增强6.用小波变换分解V分量得到每个片段的合适系数7.在每个片段上用式(22)采用反向S形转换到近似的系数8.用反小波变换重构每个片段上的V且合并它们得到增强的V9.转换HSV颜色空间到RGB颜色空间10.保存增强了的彩色图像按照这十个步骤我们首先读RGB值,然后因为增强方法是在HSV颜色空间上应用我们将它们转换到HSV。通常彩色图像用RGB颜色空间表示。因此第一步是转换RGB颜色空间到HSV颜色空间(见图3.18)。转换算法如公式(24)所示。MAX表示图像中所有像素在R、G、B上的最大值,MIN代表最小值。我们转换原始图像任意片段的每个像素的RGB值到HSV值。下一步是用K均值图像分割技术来将图像分成两部分(我们已经设定k=2)。我们同样已经把K均值技术作为一种聚类算法来使用,它按照一些定义好的距离度量来将一个数据集分成类。图像被当作最重要的传递信息的媒介之一。理解图像并从中抽取出信息以致信息可以被其他任务使用是机器学习中一个重要的方面。同样的例子是图像在机器人导航中的使用。其他应用如从医学诊断的内部的身体扫描图像中抽取出病变组织的信息。在理解图像的方向的第一步之一是分割并从中找到不同物体。为了做这一步,我们检查K均值聚类算法。图像中片段的数量已经被宣称已知,因此可以被传入算法[100]和[101]。K均值算法是一种无监督的聚类算法,它将输入的数据点分类成多个基于它们内在的彼此之间的距离的集合。算法假设数据特征构成一个向量空间并且试图找到它们中自然的聚类。K均值函数由(32)给出,下面通过六步给出算法的总结。1.计算公式(34)给出的亮度值分布(直方图)。直方图表示在某个特定色调像素的数量。它是一个映射mi,计算具有相同值的像素的数量,同时一个直方图的图形仅仅是表示直方图的一种方式。因此,如果我们令n为观察的总数,k为色调的总数,直方图mi满足下列条件:2.用式(34)给出n3.初始化(33)中k个聚类中心,它们的亮度值随机给定。4.重复下列步骤直到图像的聚类标签不再改变。5.依据它们的亮度值到聚类中心亮度值的距离来聚类这些点。6.计算每一个聚类的新的聚类中心。下一步我们对彩色图像的V分量亮度值采用小波变换来得到合适的成分,它是通过采用基于人类视觉系统的灰度等级对比度增加技术来转换得到的。然后在转换后的系数上执行反小波变换来获得增强了的V值。饱和度分量通过直方图平均化来增强。H分量没有变,因为H分量上的变化将降低HSV分量之间的色平衡。最后增强的S和V和H一起被转换回RGB值。下面的步骤展示了近似成分的对比度增强算法:a.为每个在范围[m,M]内的近似系数A用公式(26)计算Rb.用式(27)正规化R:Rmax和Rmin第一步中通过公式(22)获得的R的最大和最小值c.转换它们到近似的范围,得到新的近似系数A’。A’的范围是[m,M],R’的范围是[0,1],很方便通过公式(28)得到A’。图像用公式(29)指示的反向小波变换重构。对饱和度S我们用直方图均衡。饱和度调节的目的是使彩色图像变柔软和鲜艳。Strickland等[99]给出的分析显示了饱和度分量通常比它的亮度对应成分包含更多高频光谱能量,例如图像细节等。在他们的研究中使用了直方图均衡。为了检验我们的方法的性能,我们应用该方法到两幅不同的图像:一幅深色的彩色图像和一个低对比度的彩色图像,然后我们比较在(35)和(36)中得到的增强评估系数。作为结果,图3.23:a、b和c相应地描述了原始的深色图像,均衡色图像和亮色图像。图3.23:d、e和f是它们对应的直方图均衡彩色图,而图3.23:g、h和i是从提出方法的应用中相应增强的彩色图。我们提出的方法的结果看来不如由直方图均衡化来做增强的图像。由于取k=2,我们仅仅得到两个聚类,因此在图3.23:g中得到的图3.23:a的增强远远好于图3.23:h和i,它们由于图像(图3.23:b和c)具有不同数量的聚类这个事实而感光过度。这可以被看作在后续工作中待解决的问题。我们获得了直方图均衡的RGB彩色图像及我们提出的增强彩色图像的评价系数C和L,如表1所示。结果显示提出的方法在大多数图形类型上具有非常好的性能,甚至在该方法没有聚类阶段的不足的均衡图像上。对暗色图像直方图均衡给出C=0.063,L=0.034,而在提出的方法[82]中给出C=0.083,L=0.044,它在图像对比度上有8.3%的提高,亮度上有4.4%的提高。另一方面,均衡图对它的直方图均衡给出C=0.055,L=0.022,而我们提出的方法给出C=0.071,L=0.021,最终当我们提出的方法给出C=0.104, L=0.084时,对一幅亮色图我们得到增强的评价系数C=0.088, L=0.066。我们得出结论我们通过首先采用K均值算法来分割彩色图像到它的暗色和亮色片段获得了一个颜色对比度增强。然后我们用小波变换来确保亮度分量增强,更特别的,对由小波变换获得的近似成分参数做基于人类视觉系统的反向S形增强。饱和度分量由直方图均衡化来增强。我们提出的方法可以获得任意彩色图像的成功增强,无论它们是暗色或者低对比度或均衡化图像。然而,仍然有一些因素:亮度值和饱和度之间的关系在该方法中没有考虑,H分量没有变化。这些因素是我们将来的研究课题。我们同样获得了一种用小波变换与神经网络来实现纹理分析和分类的最优化方法。为了识别纹理,我们首先用小波变换将纹理分解成子图,并逐个分析,提取特征。根据提取出来的特征用神经网络将纹理分成不同的类别。在本文中我们分析了五种纹理,每一种使用了五幅不同的图片。我们得到了更精确的试验结果。离散小波变换被用来运行我们抽取出纹理最重要的特性,从而获得了更精确的结果。小波变换在在许多领域都很流行来解决不同的问题。小波变换通常被和傅立叶变换比较,在傅立叶变换中信号用正弦函数的和来表示。主要的不同是小波既可以时域有可以在频域定位,而标准傅立叶变换仅仅在频域定位。短时傅立叶变换(STFT)和小波变换更相似,它同样在时域和频域定位,但有频域/时域分辨率交换的问题。小波通常给出一个用多层分辨率分析的更好的信号表示,在任意时域和频域基于平衡的分辨率。LM算法(LMA)是用来训练多层前向网络(MLEF)的训练算法,它基于通过最小化误差平方和(SSE)的非线性优化技术。LM算法是Levenberg(1994)-针对最小二乘方法中的某些问题的一个解决方法和Marquardt(1963)-非线性参数的最小二乘估计的一个实现。LM算法被视为最速下降(SD)和高斯牛顿(GN)方法之间的一个折中方法。它具有比其他两个方法更好的收敛性,广为人知,它是许多离线神经网络训练中最好的选择。原因是神经网络最小化问题通常是病态条件的,LM算法在参数空间中忽略妨碍的条件,它们影响了准则[116]。在本文中我们分析了五种纹理,每一种使用了五幅不同的图片。我们得到了更精确的试验结果。我们已经主要完成了纹理分析和分类按如下六步所示:步骤1:作为输入,我们已经使用了五个纹理集合,每个集合中有五幅128*128灰度等级的图像纹理,如图4.27所示。这些组如下描述:1.第一组是泥土纹理,被称为((bkl,bk2,bk3,bk4,bk5));2.第二组是木头纹理,叫做((tree1,tree2, tree3,tree4, tree5));3.第三组是草,叫做((frm1,frm2,frm3,frm4,frm5));4.第四组是棉花组织,叫做((ctn1,ctn2,ctn3,ctn4,ctn5));5.第五组是羊毛组织,叫做((nsj1,nsj2,nsj3,nsj4,nsj5)).步骤2:二十幅随机的纹理被用来做为一个测试纹理,如图4.28所示。步骤3:这些纹理被分解为子带,它们被使用三层小波分解来分析,许多小波母函数如(coifl, coif2, Haar, db1, sym2, etc)拿来用了。在应用它们以后,我们认识到小波母函数(coifl)和(sym5)优于其他的,同时我们观察到不是纹理的所有子带都有用,于是只有有用的被保留下来。一个在图4.26中表示的信号的三层小波分解的总结如下所示:1.一个信号同时通过一个低通和高通滤波器,截断频域为采样频域的四分之一。从低通和高通滤波器的输出由第一层的近似系数(A1)和细节系数(D1)来分别代表。具有原始信号一半频域带宽的输出信号可以被向下采样依照NYQUIST法则。2.同样的过程可以对第一层近似和细节系数重复来获得第二层系数(A2)和(D2)。在分解过程的每一步,频域分辨率通过滤波加倍,时间分辨率通过向下采样减半。3.最后这个过程对第二层近似和细节系数重复来获得第三层系数(A3)和(D3)。在分解过程的每一步,频域分辨率通过滤波加倍,时间分辨率通过向下采样减半。步骤4:使用收集的特征作为每个组的三个值:第一个来自平均值,第二个来自标准偏差,第三个来自方差。这些收集的值作为每个特征的范围,均值、标准偏差和方差不是唯一的值,如表4.3和4.4所示。步骤5:输入神经网络的范围是三个值,它决定了纹理的类型。在训练阶段,人工神经网络被训练来识别依赖于表4.3和4.4的输入范围的五种纹理的类型,因为我们有五个组每组三个范围的值,神经网络的输入是(3*5=15)。步骤6:输出是五种之一,但当我们发现一些混合类型出现时,如(输出是45%来自棉花组织,55%来自羊毛组织)于是在这个阶段,我不得不通过提高人工神经网络的输出到16(3*5+1=16)来处理这个错误。我们通过增加每个输出的比例解决了这个问题。例如输出可能是来自五种类型中任意的的3/3(100%)或2/3(70%)或1/3(35%)。只有一个混合的输出可能包含混合值或者没有任何和五种类型中任一个的相似性。输出必须限制纹理的类型和来自纹理的五种类型的相似度比例。例如如果输入向量是[111],输出必须是来自木头纹理的2/3(70%);如果输入向量是[123],输出必定是混合的纹理。我们另外用来自抽取出的特征的输入的组合来训练神经网络,那么有(125)可能性,输出同样变成(125),因为我们有五种类型,每个类型有(25)可能性。训练过程终止与69/250时期,总均方误差(SSE)=2.60265×10-12如图4.29所示。使用了20幅图像,神经网络的结果很不错,测试图像的分类结果正确率接近95%。当我们用Symb5做母小波函数时,结果接近95%如表4.5所示。用Coifl做母函数的实验结果对识别纹理不适合,如表4.5所示。Coifl适合于[113]中卫星图片的远程感知。我们成功的获得了在公式(41)到(43)中从均值、STD和方差抽取出的特征。均值、STD和方差已经被用作分类的关键因素,我们已经得到更好更精确的结果。当用最大、最小和中值来抽取特征时对分类没有用,因为许多特征的相似性。本文同样简要回顾图像分割中的几种主要方法,着重比较基于区域的分割和基于边缘的分割方法来获得对图像的正确理解。图像分割是众多图像处理和计算机视觉方法中的一个重要步骤,而边缘则可描述为图像中相邻部分的边界。尽管精确的定义很难给出,但边缘检测毫无疑问是图像处理中的常见的任务。经比较后可得出如下结论:与区域分割相比,边缘检测具有无需封闭的边界的优点,而且它的计算仅仅基于差分,有利于计算;区域分割尽管可以提升多频谱图像,其缺点在于仅适用于具有封闭边界的情况。本文采用定量度量和Canny边缘检测来评价边缘检测的结果,并采用Canny真实值方法通过显示更多的细节来得到更多的特征。考虑比较基于区域的分割相对边缘检测,我们认为图像分割是许多图像处理和计算机视觉算法中重要的步骤。它的应用动机包含了非常广泛的领域,例如分析一幅航空图片的不同区域对理解空地分布很有用。从图像背景中抽取出感兴趣的目标对建造工厂自动化系统的智能机器很重要。分割和从细胞图像中计数血细胞可以帮助血液学家提高疾病诊断。场景分割同样有助于基于内容的图像检索系统[20]和[21]从大型图像数据库中提取出图像。一个区域是一组具有相似性质的连接像素。它对理解一幅图像是非常重要的,因为这个区域可能对应于一个场景中的物体。为了正确的理解,图像必须被分成对应于物体或者一个物体的部分的区域。因此,我们将研究并比较两种通用的图像分割的方法,如基于区域的分割和使用边缘检测建立边界。边缘检测是通过找到边缘区域的像素来做分割。边缘通过查看相邻像素来找到。边界区域也由计算相邻像素间的灰度值差异来形成。边缘检测可以被阐述为一个目标为检测出单个像素或为在边缘或为在边缘的像素级别的二值分类问题。为了解决这个分类问题,我们联合一个支持向量机既用了固定的也用了自适应的特征选择。一个边缘可以被非正式的描述为图像中相邻部分的边界。尽管精确的定义很难给出,但边缘检测毫无疑问是图像处理中的常见的任务。对边缘不同的应用有不同的需求,这些需求通常一方面不太正式,另一方面。缺乏正式定义已导致出现大量边缘检测的启发式算法,并使之用一种有意思的方式定量评价它们的性能很困难。在基于区域的分割中,对应于一个物体的像素被归为一类并被标记。重要的思想是值的相似度(包括了灰度值差异)和空间接近度(包含欧式距离和区域的紧密)。基于区域的分割方法同样需要使用适当的阈值技术。同样物体上的点将投影到具有相似灰度值图像上空间相近的像素上。给定一组图像像素I和一个同质性预测P(.),我们将图像I分成n个区域Ri的集合,如果公式(20)成立,任意给定区域的所有像素满足同质性预测P(2)。同样,任两个相邻的区域不能被合并成单一的区域(22)。我们通过使用正确的阈值获得了一个更好的分类。大多数算法处理建立一定参数的阈值级别。用已得图像亮度的样本,合适的阈值用一个鲁棒的算法自动设定如没有灰度值的。自动阈值使用下面之一或多个:物体的亮度值性质,物体的大小,物体占有的图像的部分,物体不同类型的数量如大小和出现的概率,最常用的亮度值分布由直方图计算来建立。表2.1总结了基于区域的和边缘检测分割方法之间的差异。在这点上,我们愿意推断出边缘检测方法具有不必使用封闭的边界的优点,即使是对多光谱图像它没有明显的改善。在基于区域的分割方法情况下,计算是基于差异度而不是相似度。在大多数场景分析和自动图形模式识别问题中分割是一个基本的预处理步骤。合适的分割技术的选择依赖于单个问题特有的特征。Canny似乎可以发现边缘附近的像素点,但它不能发现准确的边缘。因为边缘检测是如此独特的一个任务,一个适应性强的边缘检测有潜力在图像处理领域成为一个广泛运用的工具。尽管边缘检测领域被很好的研究了,我们仅仅关注一个以前的利用了支持向量机的研究[29]。该研究使用了单幅图像,且他们的结果没有超过与Canny之间视觉比较以外的性能指标。Bowyer等[28]用的算法使用像素到像素和中性像素时工作良好。作为对比,一个固定的算法例如Canny看来可以找到邻近边缘的像素,但不能找到精确的边缘。因为边缘检测是如此独特的任务,一个自适应的边缘检测器有潜力在图像处理领域成为一个广泛运用的工具。其他低层次图像处理任务如像素插值或像素重采样也是可能变得更加自适应通过重新将它们规范为机器学习领域的问题。我们可以做出结论说通过首先采用K均值算法来分割彩色图像为它的亮色和暗色部分,我们已获得了一个颜色对比度增强。然后用小波变换我们确保每个片段的亮度成分增强,更具体的说,对通过小波变换获得的近似成分系数做基于人类视觉系统的反向S形增强。饱和度分量用直方图均衡来增强。我们提出的方法获得任意彩色图像无论它们是暗色或低对比度或均衡化图像。然而,还有一些要考虑因素。亮度值和饱和度之间的关系在该方法中还没考虑,H分量没有变换。这些因素是我们将来的研究课题。我们同样开发了一个基于小波变换和人工神经网络的算法来分析和对纹理分类。在这个算法中我们联合小波和神经网络来找到合适的对纹理识别的方式。我们使用小波变换来分解纹理到子图,然后子图被分析特征提取出来。采用均值、标准偏差和方差到公式(41)到(43)中,为了决定纹理的不同类型,这些特征将成为神经网络中的关键来识别不同类型的纹理。实验结果非常精确,我们的算法成功的对纹理进行了分类。因为许多特征的相似性,用最大、最小和中值提取出的特征对分类没有用。