论文部分内容阅读
类别级物体识别与检测属于计算机视觉领域的一个基础性问题,主要研究在静态图像或视频流中识别和定位出其中感兴趣的多类物体。在类别级物体识别与检测中,过拟合、类分布不平衡和跨领域模型适应等关键问题与挑战交织在一起。当训练样本不足时,训练的模型很容易出现过拟合,即在训练数据上表现很好但是在测试数据上泛化能力很差。此外,如果不同类别物体的训练样本数量不平衡,那么训练出来的模型很容易出现偏向多数类的情况,即模型带有偏向性。由于在不同类型的图像数据上提取的特征的分布差异很大,因此在某个领域中训练的模型当进行跨领域的物体识别与检测时,模型的性能会大幅度下降。本文应用迁移学习理论来解决类别级物体识别与检测中遇到的问题,并且通过大量的实验证明了所提出的算法在完成多类物体识别与检测任务时的有效性。主要工作如下:针对小数据和类不平衡条件下的二分类物体识别问题,提出了一种跨领域的人工合成加权实例的WSMOTE方法,通过为人工合成实例分配一个合理的权重,将其动态加入TrAdaboost算法的弱分类器训练过程中。基于WSMOTE方法和TrAdaboost迁移学习框架,提出了一个WSMOTE-TrAdaboot算法,该算法可以在源领域和人工合成实例中有选择性地迁移一部分“有用”的实例到目标领域中,从而实现目标领域中正负训练样本类分布的再平衡。针对跨领域大规模多类物体识别中遇到的特征分布差异问题,提出了三个在线特征变换学习算法并从理论上证明了这三个算法的损失上界。将学习特征变换视为在线学习一个跨领域的相似性度量函数,然后利用学习到的相似性度量函数和k-NN分类器完成跨领域的多类物体识别任务。此外,还提出一种增量式地微调卷积神经网络和模型集成的方法,当只有部分预训练的源领域模型可以提供且目标领域训练样本较少时,所提出的方法可以有效地进行跨领域多类物体识别且减少过拟合的风险。针对复杂室内场景中移动机器人多类物体检测中遇到的问题,设计并实现了一个共享方位角图碎片特征的三维物体检测系统。利用三维激光测距仪构建了一个复杂室内场景的三维点云数据集DUT-3D,然后采用共享方位角图碎片特征的方式联合训练出多类物体检测器,接着使用再分类技术和HOG-LBP特征对检测输出的部分低置信率的矩形框进行再分类。提出了一个二分类的RUS-SMOTEboost算法,该算法可以在正负样本不平衡的条件下有区别地训练出一组二元分类器用于完成再分类任务。