论文部分内容阅读
随着手机、相机、摄像机等拍照设备的快速普及,人类正处于高度数字信息化的社会。对海量的照片、图像数据进行有效的组织、高效的检索成为研究的热点课题,而目标检测和识别是解决该问题的重要途径。人类视觉系统研究显示,目标检测系统可以独立于目标识别系统起作用。传统的目标检测方法普遍使用矩形框对潜在目标区域包裹进行分类识别,而矩形框内存在的背景干扰明显的影响到了正确识别目标的准确度。而基于区域分割算法得出的分割区域与目标区域吻合度不高,也影响了正确识别的效果。本文提出基于目标显著性用分层分割生成一组非规则的潜在目标区域。然后对目标候选区域提取特征并用词包模型算法进行分类。首先,针对传统的边缘检测,亮度边缘模型不能检测纹理边界,纯纹理模型也不能有效检测亮度边缘的。因此,本文采用联合亮度、颜色、纹理在内的多个线索的变化来打分。用2?直方图差算子进行了比较两个半圆盘的差异用公式计算出每个像素的边界概率。其次,由于人造环境的结构规整性本文采用基于直线检测和消失点估计的方法来计算几何上下文信息。由于,直线显著消失方向通常是属于3个正交方向,利用EM算法,将直线分组到3个显著方向并估计消失点。然后利用消失点间约束进行部分校准和相对旋转估计,得到几何上下文信息。再次,因为很多目标外观大致是同质的,所以边缘和几何结构经常能用来恢复显著目标遮挡边界。尽管不能期望定位每个目标,但能产生包括大多数目标的一个小候选区域。我们采用边界、几何结构、布局、颜色、纹理等信息联合指导定位分层分割,生成一组非规则的潜在的目标候选区域。采用结构化学习对候选区域排序,使排序最高的区域最可能对应不同目标。最后,对排序后的目标候选区域用SIFT提取图像特征,用词包模型对特征进行描述生成词包。将每张图片的词包作为特征向量用SVM分类器进行训练,并用于分类识别。本文在VisualStudio+OpenCV平台上,首先用显著目标检测算法生成非规则的潜在目标候选区域并对其排序,然后用基于词包模型的目标识别算法进行分类,并得到了良好的识别效果。