Boosting算法的改进及其在视觉目标检测中的应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：flyrat1997

【摘要】

：

Boosting是一类提高弱学习算法精度的强学习算法,具有坚实的理论基础,凭借其高效、易用和良好的泛化性能被广泛应用于模式识别的各个领域,尤其在Viola和Jones提出“Haar矩形

【作者】

：

李秋洁

【机构】

：

南京理工大学

【出处】

：

南京理工大学

【发表日期】

：

2011年期

【关键词】

：

boosting算法视觉目标目标检测特征失配人脸检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Boosting是一类提高弱学习算法精度的强学习算法,具有坚实的理论基础,凭借其高效、易用和良好的泛化性能被广泛应用于模式识别的各个领域,尤其在Viola和Jones提出“Haar矩形特征+AdaBoost+级联检测器”后,“底层特征+boosting”视觉目标检测框架成为迄今解决视觉目标检测的一条最有效的途径。　　本文研究boosting算法的改进及其在视觉目标检测中的应用,综述boosting算法的研究现状,提出三种解决不平衡数据分类问题的boosting改进算法,并对“底层特征斗+boosting”视觉目标检测框架进行改进和应用推广。　　不平衡数据分类问题强调少数类的分类精度,而boosting算法最小化数据的整体分类错误率上界,对少数类的分类效果较差。现有改进方案被本文归纳为数据采样法和代价敏感法两类:数据采样法每轮迭代使用过采样/欠采样降低类别不平衡程度,但算法计算量大,采样过程容易引入噪声或丢失有用数据信息;代价敏感法对少数类赋予较高的误分代价,使得分类器向其倾斜,但算法大多为启发式,并存在代价因子较大时算法性能显著下降的问题,缺少一个理论框架来解释其有效性。本文从代价敏感学习、采样、AUC优化三个角度研究针对不平衡数据分类问题的boosting改进算法,分别完成了:(1)提出代价敏感boosting的理论框架,揭示并解释现有算法存在的不稳定问题,并给出稳定的新算法。本文从统计学角度指出代价敏感boosting实质是通过优化某种代价敏感准则拟合非对称logistic回归模型,现有算法采用随迭代次数指数增长的代价因子,导致代价因子较大时算法性能显著下降。本文提出采用一致代价因子的代价敏感boosting算法CSBoost.DA和CSBoost.GA,在UCI不平衡数据集、人脸数据集、车牌数据集上的实验表明,对于不平衡数据分类问题,新算法优于原始boosting和现有代价敏感boosting:(2)分类边界附近的样本对分类器性能起着关键作用,受这一思想的启发,提出基于边界少数类样本过采样的边界采样boosting算法。与数据采样法不同,采样结果通过样本权重反映,并不产生或删除数据,从而避免噪声引入和有用信息丢失。新算法融合数据采样法和代价敏感法的优点,高效、适应性强,在UCI不平衡数据集上的实验表明,新算法优于原始boosting和代价敏感boosting;(3)AUC是不平衡数据分类问题中的一个常用评估指标,提出一种最优化AUC的boosting算法,从全新的角度研究基于boosting的不平衡数据分类问题。通过分析AUC与分类错误率的关系,指出平衡类别分布是将最大化AUC与最小化分类错误率等价的关键,基于此思想提出RcbalanccdBoost。新算法每轮迭代前先平衡类别分布,可证明其学习目标为最大化AUC下界。在UCI不平衡数据集上的实验表明,在AUC测度下新算法优于原始boosting算法。　　 “底层特征+boosting”框架已成为视觉目标检测领域的一个标准方法,一直以来,研究者们从特征提取和学习算法两方面进行改进。本文指出框架仍存在一个根本性的问题——特征失配,亟待解决。由于特征大多从图像的固定位置提取,受到目标姿态多样性、局部变形等因素的影响,不同目标实例中同一特征所在位置可能不同,从而影响最终检测器的性能。针对特征失配问题,本文提出基于多配置特征包的boosting算法。用多配置特征包模拟不同的特征失配情况,由boosting算法选择出最优特征包和相应配置,构成目标分类器。弱分类器学习时,引入多示例学习的思想,将特征包分类器学习转化为单个特征分类器的学习。在人脸数据集上的实验表明,基于多配置特征包的boosting算法能获得更快的收敛速度和更好的检测性能。此外,本文将“底层特征+boosting”视觉目标检测框架应用于解决具体的计算机视觉问题,主要包括:(1)图像CAPTCHA破解。图像CAPTCHA ARTiFACIAL基于人脸和面部特征识别,由于引入背景噪声、光照不均和人脸形变,现有算法破解率不超过0.0006％。　　本文根据ARTiFACIAL产生机制,设计基于梯度的人脸检测器,并引入面部器官检测器提高人脸配准精度,将ARTiFACIAL的破解成功率提升为18.0%;(2)图像方向检测。图像方向检测可看作区分竖直/非竖直图像的二分类问题。将“底层特征+boosting”框架与bagging相结合,提出一种可扩展的图像方向检测器。与现有算法相比,新算法具有可扩展性,在确保检测精度的同时极大地降低了训练和检测的复杂度。　　本文最后给出可进一步展开的研究工作,指明后续的研究方向。

其他文献

城市排水生产协作平台软件研发

随着城市排水业务的发展与公司规模的扩大，对生产协作的要求日益增加，现有零散的计算机应用，以及传统的协调手段已经不能满足需要，存在着“信息不畅、职责不明、效率低下”等问题

学位

城市排水生产协作平台软件开发工作流管理用户体验

平行弦丝电容传感器两相流测量特性研究

许多工业生产过程中广泛存在两相流流动现象,如石油,能源,制药和日用化工等行业生产过程中。在这些工业生产过程中,两相流各分相流量、相含率等流动参数的准确测量对生产过程

学位

两相流相含率平行弦丝电容传感器有限元分析多尺度分形

基于径向基神经网络的机电系统精确模型辨识方法研究

本文主要研究伺服系统的精确建模问题,通过分析机理建模的复杂与不精确的问题,指出引入神经网络建模能带来的快速性、精确性以及简便性的提升。而目前针对神经网络辨识的研究虽然有很多改进方案,但是大多都只是在一些特定的仿真模型下效果较好,缺乏实际系统的验证,有些算法甚至并不适用于实际系统辨识,因此本文研究基于神经网络的伺服系统精确模型辨识问题,主要的研究成果可归纳为:首先,对一类以永磁同步电机为执行元件的位

学位

神经网络建模径向基神经网络伺服系统混合OLS-GD法

密集杂波下声网络无源定位算法研究

无源声探测技术通过声传感器探测网络接收低空、超低空飞行目标的方位角等信息，利用信息融合技术，实现对目标的无源定位和跟踪。由于受环境噪声的干扰较大，使得无源声探测网接收

学位

声探测杂波预处理无源定位时延数据关联

有铁芯直线电机推力波动的分析与补偿方法研究

当今时代,精密运动平台在各行各业中都受到广泛应用,例如IC制造业、航天航空业、精密机械加工业等。其中,永磁直线电机在高速度、高精度、高载荷的运动控制中应用最为广泛。

学位

有铁芯直线电机推力波动模型辨识迭代学习控制扰动观测器

基于SIP-C协议的飞信机器人开发及应用

飞信机器人是基于SIP-C协议开发的一种高效免费的IM通讯机器人自动应答工具。与传统的网页查询与获取信息的方式不同,飞信机器人具备完整的命令行工具、标准的核心协议实现、

学位

PTU机器人人机交互计算机技术程序设计

基于Orocos的工业机器人轨迹跟踪研究

机器人是一个复杂动态体系,能够用在不同领域。现在工业生产线上特别是汽车行业,多自由度机器人的应用非常广泛。本文以ER3A-C60工业机器人作为研究对象,讨论了六自由度工业

学位

Orocos运动学机器人轨迹规划逆运动学闭环控制

气水两相流局部速度相关测量方法研究

多相流是指流体中同时含有两种或两种以上物质(相)的形式。两相流是多相流一种特殊流动形态,广泛存在于自然界和工业生产过程中。由于两相流动过程复杂,存在剧烈的变化,因此

学位

气水两相流局部速度相关测量场心截面信息测量系统

基于ZigBee技术的无线传感器网络定位系统的设计与研究

随着人类社会的发展,基于位置的服务越来越频繁的被应用到生活中,例如车辆导航、人员定位、网络社交签到等。这也使得定位技术的重要性日益凸显。无线传感器网络(Wireless Se

学位

无线传感器网络定位测距接收信号强度指示奇异值分解法

信标节点信息为参考的RSSI定位算法及其应用研究

无线传感器网络指的是由大量体积小、成本低、具有无线通信、传感、数据处理的传感器节点组成的无线网络，在医疗、军事、环境监测等领域得到了广泛的应用，作为一种全新的信息采

学位

无线传感器网络信标节点无线定位算法RSSI测距概率计算法

Boosting算法的改进及其在视觉目标检测中的应用研究

与本文相关的学术论文