论文部分内容阅读
图像识别属于人工智能的一部分,是当前学术前沿,诞生了众多的研究分支。本文选择了对图像识别的基础算法加以研究,分别为图像相似度、边缘检测和物体轮廓定位方法,并提出了新的计算方法。本文研究内容如下所示:(1)图像相似度是图像检索的基础,从海量图片中检索特定的相似的图片不仅需较高的准确性,更重要的是要达到很快的计算速度。本文提出了一种在HSV颜色空间中计算两幅图像距离的新方法。首先,将图像分块并计算每个图像块的主颜色直方图。然后,使用二次式距离函数(能充分利用HSV颜色之间的相似度)获得主颜色直方图之间的距离。这里,提出了一种新的计算HSV颜色相似度的方法。最后,使用最佳匹配策略,通过加权每对图像块之间的距离计算出图像的相似度。算法的有效性和性能在模拟和真实的图像集上得到了充分的验证。(2)边缘检测是图像识别的关键,涌现了一批经典的检测算法,如Sobel算子、Roberts算子、Prewitt算子、Kirsch算子、Canny算子、SUSAN算子等。其中Canny算子达到了最佳的效果,但其检测到的边缘有些粗糙,为了便于进一步处理。本文提出一种边缘去杂及连通性增强算法-蠕虫算法,首先通过Canny边缘检测算法得到待处理的边缘图像,然后使用该算法去除边缘图像中的杂边、毛刺(伪边缘)等因素同时保持边缘的连通性。实验结果表明,本算法有良好的性能,使得边缘图像简洁清晰,较之边缘细化算法能更简单有效地去除杂边,且在一定程度上去除了椒盐噪声对边缘图像的影响。(3)物体轮廓定位可以归属于图像分割算法,用来获得物体的边缘外形。为了达到实时性要求,综合各种算法,本文提出了一种快速定位物体轮廓的方法。首先,将RGB图像转换为YCrCb图像并在待识别物体上选取一个候选点;然后使用SUSAN检测核(mask)检测该点是否属于边缘点,不是边缘点则将mask朝八个方向平移,移动过程中使用盒子码本模型(Box-based Code Book Model, BCB)统计核覆盖的所有像素,建立物体的特征模型;最后,当mask到达边缘点,综合利用mask和特征模型,采用广度优先遍历找到所有相互邻接的轮廓点便得到了物体轮廓。最后将算法应用到了一个实时手势识别系统来验证其性能。