论文部分内容阅读
无人机图像中的人体检测是计算机视觉领域一个较为热门和关键的研究课题,对社会发展和工业进步具有重要意义。在人工智能(Artificial Intelligence)和四旋翼飞行器产业高速发展的背景下,其应用领域也日趋广泛,例如:智能交通识别系统、重灾区的人体检测、智能终端人机交互等多个领域。由于应用场所的复杂性、具体环境的多样性、目标姿态的非一致性等因素的影响,使得人体检测任务对算法的鲁棒性和准确性提出更高的要求。本文就低空四旋翼无人机航拍图像中人体检测算法进行研究,主要探究人体检测算法的旋转不变性。根据不同的技术角度,本文将围绕两种不同的实现方法展开研究。 第一种实现方法是特征提取算子加上分类器模型。2005年,由Dala等人提出的HOG(Histograms of Oriented Gradients)算子,该算法提取图像的方向梯度作为特征的思想别具一格。同时,该团队创建了INRIA人体检测数据库,为人体检测算法的发展做出了巨大贡献。虽然HOG算子能够非常准确的提取人体图像中的方向梯度,但无法克服图像仿射变换尤其是旋转变换带来的影向。第二种实现方法是利用卷积神经网络CNNs(Convolutional Neural Networks)。2012年,由深度学习领军人物Hinton及其团队提出的AlexNet是卷积神经网络在计算机视觉领域快速发展的基石,更是获得了当年大规模计算机视觉挑战赛ILSVRC(Image Large Scale Visual Recognition Challenge)的冠军。鉴于以上两点,本文的具体研究内容如下: (1)采用旋转不变性LBP(Local Binary Pattern)特征提取算子对原始图片进行纹理特征提取,形成LBP特征向量。然后,利用对数极坐标变换(Log Polar Transform)公式对原始图像进行坐标系变换,将图像从笛卡尔坐标系变换到对数极坐标系,并采用双线性二次插值算法对变换坐标系后的图片空白像素进行灰度插值。 (2)提取对数极坐标变换后图像的HOG特征,形成HOG特征向量。从HOG特征数据的直方图分析,对数极坐标变换在一定程度上实现了HOG特征的旋转不变性,但是因为对数运算和插值运算的特性,压缩了HOG特征的数据信息。 (3)为了克服数据压缩带来的影响,本文将提取到的LBP特征向量和HOG特征向量进行简单的组合,形成LPT-HOG-LBP的联合特征。随后使用线性核-支持向量机(lib-SVM)分类器在INRIA数据库上进行二分类实验。 (4)本文使用Caffe深度学习框架,测试了AlexNet这一经典的卷积神经网络在人体检测任务中的性能,并探究了学习率下降策略这一超参数对网络训练阶段的影响。 (5)本文在INRlA数据集上进行实验,对两种不同技术手段的性能进行验证和测试。实验数据表明两种技术手段在人体检测算法都能较好地实现人体检测算法的旋转不变性,但性能上深度学习方法更胜一筹。 (6)最后本文将性能较好的AlexNet模型应用到实际拍摄的图像当中,从人体检测效果来看,本文训练的AlexNet模型较好地实现了无人机图像中的人体检测任务。