论文部分内容阅读
近年来随着科技的发展和进步,人工智能正在逐渐走进人们的生活,由于人类主要通过视觉来获取外界信息,人工智能在视觉方向的发展显得格外重要,而目标检测则是视觉领域的重中之重。随处可见的人脸闸机,车牌识别系统等都离不开高精度的目标检测算法。随着对检测算法研究的不断深入,检测的准确率和召回率都在不断提高,然而通用的目标检测方法在很多领域中仍无法达到精度要求。本文针对这个问题,提出了融合先验知识的目标检测与定位方法,在融合了已知图案,合理空间等先验知识的条件下,提高特定场景下目标检测的准确率和召回率,具体的研究内容归纳为如下几个方面:第一,介绍了分类网络ResNet和目标检测方法Faster-Rcnn。讲解了Resnet网络的结构原理,之后分别从Roi-pooling层,区域建议网络,网络的损失函数等方面详细叙述了Faster-Rcnn算法进行目标检测的过程。本文采用了Roi-Align层代替了Roi-pooling层,说明了Roi-Align对定位精度的提升,并介绍了FPN网络的原理。第二,介绍了目标检测方法的评价指标,分析发现部分目标分类成功率天然优于其他目标,且易与背景区分。为提高物体在复杂环境下的识别成功率,并确定物体的位置姿态,本文在环境中引入了图案作为人工标识,图案选取了室内艺术装饰图案,设计了图案的可分类型评价指标,优选出了相互混淆且易与背景区分的图案子集。第三,首先介绍了利用双目相机进行目标定位的原理,在大型目标上粘贴两个已知距离的图案,结合Faster-Rcnn和模板匹配的方法计算双目视差并解算出目标位置姿态。以大物体的位置姿态作为先验知识,设计三维空间的空间约束条件,降低目标检测概率阈值,找出所有出现在合理位置的检测框。最后,设计了融合HOG特征和卷积特征的ResNet-S网络,利用SENet网络计算不同特征图的不同权重的思想将HOG特征和卷积特征相结合,设计了自适应权重的特征融合分类器;用多个二分类器代替多分类器,使得分类器可以精准检测差别较小的同类物体,实现精准分类。