Boosting算法的改进及其在视觉目标检测中的应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:flyrat1997
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Boosting是一类提高弱学习算法精度的强学习算法,具有坚实的理论基础,凭借其高效、易用和良好的泛化性能被广泛应用于模式识别的各个领域,尤其在Viola和Jones提出“Haar矩形特征+AdaBoost+级联检测器”后,“底层特征+boosting”视觉目标检测框架成为迄今解决视觉目标检测的一条最有效的途径。   本文研究boosting算法的改进及其在视觉目标检测中的应用,综述boosting算法的研究现状,提出三种解决不平衡数据分类问题的boosting改进算法,并对“底层特征斗+boosting”视觉目标检测框架进行改进和应用推广。   不平衡数据分类问题强调少数类的分类精度,而boosting算法最小化数据的整体分类错误率上界,对少数类的分类效果较差。现有改进方案被本文归纳为数据采样法和代价敏感法两类:数据采样法每轮迭代使用过采样/欠采样降低类别不平衡程度,但算法计算量大,采样过程容易引入噪声或丢失有用数据信息;代价敏感法对少数类赋予较高的误分代价,使得分类器向其倾斜,但算法大多为启发式,并存在代价因子较大时算法性能显著下降的问题,缺少一个理论框架来解释其有效性。本文从代价敏感学习、采样、AUC优化三个角度研究针对不平衡数据分类问题的boosting改进算法,分别完成了:(1)提出代价敏感boosting的理论框架,揭示并解释现有算法存在的不稳定问题,并给出稳定的新算法。本文从统计学角度指出代价敏感boosting实质是通过优化某种代价敏感准则拟合非对称logistic回归模型,现有算法采用随迭代次数指数增长的代价因子,导致代价因子较大时算法性能显著下降。本文提出采用一致代价因子的代价敏感boosting算法CSBoost.DA和CSBoost.GA,在UCI不平衡数据集、人脸数据集、车牌数据集上的实验表明,对于不平衡数据分类问题,新算法优于原始boosting和现有代价敏感boosting:(2)分类边界附近的样本对分类器性能起着关键作用,受这一思想的启发,提出基于边界少数类样本过采样的边界采样boosting算法。与数据采样法不同,采样结果通过样本权重反映,并不产生或删除数据,从而避免噪声引入和有用信息丢失。新算法融合数据采样法和代价敏感法的优点,高效、适应性强,在UCI不平衡数据集上的实验表明,新算法优于原始boosting和代价敏感boosting;(3)AUC是不平衡数据分类问题中的一个常用评估指标,提出一种最优化AUC的boosting算法,从全新的角度研究基于boosting的不平衡数据分类问题。通过分析AUC与分类错误率的关系,指出平衡类别分布是将最大化AUC与最小化分类错误率等价的关键,基于此思想提出RcbalanccdBoost。新算法每轮迭代前先平衡类别分布,可证明其学习目标为最大化AUC下界。在UCI不平衡数据集上的实验表明,在AUC测度下新算法优于原始boosting算法。   “底层特征+boosting”框架已成为视觉目标检测领域的一个标准方法,一直以来,研究者们从特征提取和学习算法两方面进行改进。本文指出框架仍存在一个根本性的问题——特征失配,亟待解决。由于特征大多从图像的固定位置提取,受到目标姿态多样性、局部变形等因素的影响,不同目标实例中同一特征所在位置可能不同,从而影响最终检测器的性能。针对特征失配问题,本文提出基于多配置特征包的boosting算法。用多配置特征包模拟不同的特征失配情况,由boosting算法选择出最优特征包和相应配置,构成目标分类器。弱分类器学习时,引入多示例学习的思想,将特征包分类器学习转化为单个特征分类器的学习。在人脸数据集上的实验表明,基于多配置特征包的boosting算法能获得更快的收敛速度和更好的检测性能。此外,本文将“底层特征+boosting”视觉目标检测框架应用于解决具体的计算机视觉问题,主要包括:(1)图像CAPTCHA破解。图像CAPTCHA ARTiFACIAL基于人脸和面部特征识别,由于引入背景噪声、光照不均和人脸形变,现有算法破解率不超过0.0006%。   本文根据ARTiFACIAL产生机制,设计基于梯度的人脸检测器,并引入面部器官检测器提高人脸配准精度,将ARTiFACIAL的破解成功率提升为18.0%;(2)图像方向检测。图像方向检测可看作区分竖直/非竖直图像的二分类问题。将“底层特征+boosting”框架与bagging相结合,提出一种可扩展的图像方向检测器。与现有算法相比,新算法具有可扩展性,在确保检测精度的同时极大地降低了训练和检测的复杂度。   本文最后给出可进一步展开的研究工作,指明后续的研究方向。
其他文献
随着城市排水业务的发展与公司规模的扩大,对生产协作的要求日益增加,现有零散的计算机应用,以及传统的协调手段已经不能满足需要,存在着“信息不畅、职责不明、效率低下”等问题
许多工业生产过程中广泛存在两相流流动现象,如石油,能源,制药和日用化工等行业生产过程中。在这些工业生产过程中,两相流各分相流量、相含率等流动参数的准确测量对生产过程
本文主要研究伺服系统的精确建模问题,通过分析机理建模的复杂与不精确的问题,指出引入神经网络建模能带来的快速性、精确性以及简便性的提升。而目前针对神经网络辨识的研究虽然有很多改进方案,但是大多都只是在一些特定的仿真模型下效果较好,缺乏实际系统的验证,有些算法甚至并不适用于实际系统辨识,因此本文研究基于神经网络的伺服系统精确模型辨识问题,主要的研究成果可归纳为:首先,对一类以永磁同步电机为执行元件的位
无源声探测技术通过声传感器探测网络接收低空、超低空飞行目标的方位角等信息,利用信息融合技术,实现对目标的无源定位和跟踪。由于受环境噪声的干扰较大,使得无源声探测网接收
当今时代,精密运动平台在各行各业中都受到广泛应用,例如IC制造业、航天航空业、精密机械加工业等。其中,永磁直线电机在高速度、高精度、高载荷的运动控制中应用最为广泛。
飞信机器人是基于SIP-C协议开发的一种高效免费的IM通讯机器人自动应答工具。与传统的网页查询与获取信息的方式不同,飞信机器人具备完整的命令行工具、标准的核心协议实现、
机器人是一个复杂动态体系,能够用在不同领域。现在工业生产线上特别是汽车行业,多自由度机器人的应用非常广泛。本文以ER3A-C60工业机器人作为研究对象,讨论了六自由度工业
多相流是指流体中同时含有两种或两种以上物质(相)的形式。两相流是多相流一种特殊流动形态,广泛存在于自然界和工业生产过程中。由于两相流动过程复杂,存在剧烈的变化,因此
随着人类社会的发展,基于位置的服务越来越频繁的被应用到生活中,例如车辆导航、人员定位、网络社交签到等。这也使得定位技术的重要性日益凸显。无线传感器网络(Wireless Se
无线传感器网络指的是由大量体积小、成本低、具有无线通信、传感、数据处理的传感器节点组成的无线网络,在医疗、军事、环境监测等领域得到了广泛的应用,作为一种全新的信息采