融合先验知识的深度学习目标识别与定位研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ysli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着科技的发展和进步,人工智能正在逐渐走进人们的生活,由于人类主要通过视觉来获取外界信息,人工智能在视觉方向的发展显得格外重要,而目标检测则是视觉领域的重中之重。随处可见的人脸闸机,车牌识别系统等都离不开高精度的目标检测算法。随着对检测算法研究的不断深入,检测的准确率和召回率都在不断提高,然而通用的目标检测方法在很多领域中仍无法达到精度要求。本文针对这个问题,提出了融合先验知识的目标检测与定位方法,在融合了已知图案,合理空间等先验知识的条件下,提高特定场景下目标检测的准确率和召回率,具体的研究内容归纳为如下几个方面:第一,介绍了分类网络ResNet和目标检测方法Faster-Rcnn。讲解了Resnet网络的结构原理,之后分别从Roi-pooling层,区域建议网络,网络的损失函数等方面详细叙述了Faster-Rcnn算法进行目标检测的过程。本文采用了Roi-Align层代替了Roi-pooling层,说明了Roi-Align对定位精度的提升,并介绍了FPN网络的原理。第二,介绍了目标检测方法的评价指标,分析发现部分目标分类成功率天然优于其他目标,且易与背景区分。为提高物体在复杂环境下的识别成功率,并确定物体的位置姿态,本文在环境中引入了图案作为人工标识,图案选取了室内艺术装饰图案,设计了图案的可分类型评价指标,优选出了相互混淆且易与背景区分的图案子集。第三,首先介绍了利用双目相机进行目标定位的原理,在大型目标上粘贴两个已知距离的图案,结合Faster-Rcnn和模板匹配的方法计算双目视差并解算出目标位置姿态。以大物体的位置姿态作为先验知识,设计三维空间的空间约束条件,降低目标检测概率阈值,找出所有出现在合理位置的检测框。最后,设计了融合HOG特征和卷积特征的ResNet-S网络,利用SENet网络计算不同特征图的不同权重的思想将HOG特征和卷积特征相结合,设计了自适应权重的特征融合分类器;用多个二分类器代替多分类器,使得分类器可以精准检测差别较小的同类物体,实现精准分类。
其他文献
采用扫描电镜(SEM)、电子探针(EPMA)、显微硬度及X射线衍射(XRD)等测试方法,对Al/45钢氩气保护高频感应钎焊界面附近的显微组织性能进行了试验研究。试验结果表明,结合面钎料
超声波是频率超过人耳听觉频率极限机械波的总称,它可以在气体、液体、固体中传播。超声波位置传感器是利用超声波的特性研制而成的传感器。本论述以检测技术中主要采用的压
运用系统功能语言学的理论,以2004年1月至2005年7月期间《金融时报》和《中国日报》英文版的财经新闻报道为研究对象,探讨了财经新闻报道文体特定的语言表达方式,并验证了将
近几年内,随着我国商业银行的蓬勃发展,其理财产品类型开始逐渐以销售结构型、保本型和非保本型为主,然而,各类理财产品的会计处理方法却存在着一定的差异,从而不仅为理财产
高中信息技术课程是一门内容较为丰富、实践性要求较高的学科。主题式教学方法能够在有效激发高中生对于信息技术课程学习热情和学习兴趣的基础上,不断提升学生对信息技术知
在知识更新迅速的信息化时代,教会学生学会学习比教给学生知识更重要。以学生为中心的探究式教学能充分调动学生学习的积极性,有利于学生掌握知识、提高综合能力、培养学科核心素养。本文对相关化学课外活动、化学科学探究活动的教育研究文献进行系统调研,梳理科学探究和课外活动的概念,并界定化学课外科学探究性活动的概念。基于建构主义、探究学习和杜威的实用主义教育等理论设计化学课外科学探究性活动项目。项目设计包括活动
不起诉制度的核心在于保障公民的合法权益和节省司法资源,本文通过探讨不起诉制度的适用上存在的问题,并提出合理的建议,以期对保障犯罪嫌疑人人权的保障、司法职能的发挥和
分析《认识角》是苏教版数学二年级下册第七单元《角的初步认识》的第一课,本节课的内容是在学生初步认识了长方形、正方形、三角形等几何图形的基础上进行教学的,教材结合生
随着沈阳市经济的发展,铁西区进驻企业不断增多,使得污水排放量也逐年增加。目前铁西区污水量已经达到30万m3/d,而现有的化工园污水处理厂及沈阳市西部污水处理厂都处在满负
解决当前高职学生就业问题的关键是提高就业能力。企业作为吸纳毕业生的主要载体,有责任提高高职学生就业能力。企业要参与课程建设和实习实训基地建设、接收高职学生顶岗实