论文部分内容阅读
图像理解是当前计算机研究领域的热点,其主要研究内容是场景中目标识别和场景的描述与理解。分类和检测是场景中目标识别的关键问题,通过对样本的训练学习产生判别决策,得到识别结果,判别模型的好坏会对识别结果产生重要影响。Boosting方法将比随机猜测略好的弱分类器合并为精确的强分类器,能够解决图像理解中更一般的目标识别问题。本文的主要工作如下:(1)探讨了Boosting分类机制,概述了两大系模型:AdaBoost和Boost-by-Majfority,分别从训练样本和弱分类器的权重、损失函数及其特性四个方面归类比较了拓展模型,形成了较为完整的Boosting分类模型体系;(2)从指数准则和对数似然准则两个方面阐述了Boosting模型的统计本质,通过数据分类实验比较了Real AdaBoost和Gentle AdaBoost两种模型,验证了Gentle AdaBoost的优点,奠定了模型选择的理论基础;(3)分析了传统图像集和融入视觉知识的LabelMe图像集的特点,获取特定目标类别图像并修改其注释,创建了适合场景中目标识别的含有特定目标类别的图像集;(4)总结了场景中目标识别的内涵和现有方法,实现了基于GentleAdaBoost的场景中目标识别,判断场景中是否有特定目标并确定目标出现的位置,最后通过查全率/查准率曲线对识别结果进行评价。