基于背景差分与少样本分类的桌面机械臂目标检测研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:Shimq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件成本的降低,广泛应用于工业界的机械臂以低成本、轻量级的桌面机械臂的形式进入了人们的日常生活中。相较于工业机械臂单一的工作任务,桌面机械臂需要一个更灵活的目标检测方法来应对日常生活中多样的任务。成熟的目标检测方法包括两类,一类为传统目标检测方法,其需要在模型中添加待检测目标的特征描述子;另一类是基于深度学习的目标检测方法,其需要使用大量的待检测目标数据来训练神经网络模型。这两类方法均无法在模型不做修改的前提下迁移到对新类别的检测中,即它们的模型高度依赖于待检测目标。但是大量无专业知识的桌面机械臂用户只能使用机械臂出厂时所提供的目标检测系统,无法对系统中没有预设的目标进行检测,用户不能根据自己的需求随意更换被抓取的目标。基于少样本学习(Few-Shot Learning)的目标检测方法可以解决模型高度依赖于待检测目标的问题,因为少样本学习方法可将学会的通用知识直接迁移到新任务的处理中。但是现有基于少样本学习的目标检测方法精度都较低,主要有以下缺点:(1)在少量样本的前提下,无论是基于滑窗、候选区域(Region Proposal)的方式,还是基于锚(Anchor)的方式对目标的定位都不够准确。这些方式不仅需要对定位进行回归处理,而且还引入了大量无用背景,增加了模型的分类难度;(2)现有的公共数据集具有目标不显著、背景复杂以及同类差异大等特点,这要求模型必须具备很好的泛化能力才能得到满意的效果,然而少样本与泛化能力本是矛盾的。本文考虑到桌面机械臂(相机安装方式为眼在手外)场景中相机与背景都是静态的特点,并利用了少样本学习具有良好迁移性的优势,提出了一种基于背景差分与少样本分类的桌面机械臂目标检测方法。对于上述缺点(1),本方法并未采用滑窗、候选区域和锚的方式来对目标进行定位,而是使用基于改进背景差分的前景提取方法对目标进行准确定位并对目标进行像素级提取,无需对定位进行回归处理。然后直接使用基于改进关系网络的少样本分类方法对提取出的目标进行分类。由于提取得到的目标是不包含背景的显著目标,所以分类结果拥有极高的准确率。对于上述缺点(2),本方法通过基于改进背景差分的前景提取方法从视频帧中提取出无背景且目标显著的图像,然后使用这些图像作为数据集来训练基于改进关系网络的少样本分类模型,进一步地提升了分类的准确率。具体来说,本文的工作如下:(1)提出了基于改进背景差分的前景提取方法。(1)本方法通过加装一块辅助板,解决了相机在与用户交互的过程中容易发生偏移的问题,并且还可以排除人手等非目标前景的干扰;(2)对于多个目标重叠导致目标前景发生粘连的问题,本方法采用了基于分水岭算法的粘连分割方法将各个目标前景进行分割;(3)对于多纹理背景环境中噪声较多的问题,本方法提出了三帧阈值法;(4)对于难以提取出与背景相似的目标前景的问题,本方法提出了差异度来描述像素点。实验表明,本方法能在光线变化、目标前景与背景相似、相机或背景发生轻微移动的情况下正常工作。(2)针对基于关系网络(Relation Network)的少样本分类方法进行了5点改进。(1)关系网络的本质就是度量查询集(Support Set)与支持集(Query Set)的相似度,其本身是一个回归问题。但现有公共数据集中只有类别标注,无法在这些数据集上进行回归处理,所以本方法使用了带权的颜色直方图相似性度量对数据集进行相似度标注;(2)考虑到桌面机械臂抓取应用中并不需要区分差异过大的同类目标,以及少样本与泛化能力的对立性,所以本方法将少样本分类的“是哪一类”问题变更为“是哪一个”问题,使其更加符合相似度度量问题;(3)分析了少样本分类方法在数据集Omniglot上表现良好,而在数据集mini Image Net上准确率较低的原因,建立了更适合少样本分类的数据集NBI(No Background Image);(4)针对现有方法在训练网络模型时固定N-way K-shot任务中N、K值的训练方式会导致模型依赖于与N、K值的现象,提出了Rand-way Rand-shot训练方式;(5)在模型中加入了颜色直方图相似性度量模块来度量样本间浅层特征的相似度,用于修正模型明显的误判。实验表明,这些改进使得基于关系网络的少样本分类方法的准确率有明显提高。(3)基于上述方法在像素中对目标的定位结果,提出了一种无需手眼标定的目标空间定位方法。实验表明,该目标检测方法能够在不同桌面机械臂应用中进行准确的目标检测并给出目标的二维位姿。而且在新增目标类别时,仅需要对新类别目标拍摄少量照片作为支持样本即可实现对新增类别的检测,非专业人员也能进行操作。
其他文献
背景:5-羟色胺2A受体(5-hydroxytryptamine 2A receptor,5-HT2A受体)是广泛表达于中枢神经系统中的重要的5-羟色胺受体,其结构和功能的异常与许多精神疾病有关,在一系列精神疾病中起着重要的作用,并且是非典型抗精神病药物的治疗靶点。感觉门控是指在充满刺激的环境中,从显著的感觉信息中过滤无关的感觉信息然后执行与注意力相关的认知过程,从而对显著的刺激做出反应。前脉冲抑
川东平行岭谷区地处四川盆地东部,是我国东北-西南走向山脉组合最整齐地区,亦为世界上最典型的褶皱山地带,与美洲的阿巴拉契亚山和安第斯-落基山并称为世界三大褶皱山系。在地理学家眼中,这种岭与谷相互平行的地貌组合形态是一种极具代表性与吸引力的地理现象。川东平行岭谷区内的山脉广泛分布可溶性碳酸盐岩,在水文地质作用下,形成“土在楼上,水在楼下”的二元空间结构。岩溶地貌对外界环境变化反应敏感,污染物在土壤圈和
绘本是一种蕴含丰富视觉图像的艺术形式,基于绘本展开的美术教学有利于学生创意思维、审美感知、图像识读、文化理解等素养的养成。然而,当前绘本美术课堂存在教学形式单一、教学内容同质化严重等问题,反映了现阶段的绘本美术教育理念滞后于时代发展,不足以促进学生的成长。具身认知理论主张人类的认知源于物理感官和学习环境的交互作用,而这正与绘本阅读的情景性,以及美术创作的实践性相通,对绘本美术教育的革新有着独特的启
元话语作为一类常见且重要的语言现象,已成为系统功能语言学研究的重点领域之一。以往对元话语的研究主要集中在学术语篇及课堂话语等方面,很少有对慕课教师话语中的元话语进行研究并通过其分析慕课教师语用身份的研究。在此背景下,本文基于Hyland(2005a)的互动模式以及陈新仁(2013)的语用身份论对中美慕课进行对比研究,探究慕课教师的元话语使用特点以及其中的语用身份构建。具体来说,本研究拟回答以下三个
在紫色砂页岩上形成的紫色土是我国南方主要的土壤之一,但其成土土壤结构松散,具有较高的入渗性能,同时坡耕地中根孔、虫孔等大孔隙优先流通道进一步增加了土壤入渗水分,入渗的水在近地表弱透水层上方形成近地表水流。近地表水流会减弱土壤的胶结能力,削弱土壤抗侵蚀能力,加剧土壤侵蚀。近地表水流作用下会造成强烈的土壤侵蚀。本文以坡耕地紫色土为研究对象,通过限定性细沟模拟冲刷试验,从土壤弱透水层上方供水,通过控制水
随着社会发展和人口老龄化趋势,很多人的精神将长期处于压力状态,以至于产生焦虑、抑郁等精神疾病,此类精神疾病会对日常生活及身体健康造成许多不良影响,抑郁症也是产生自杀行为的原因之一,如今抑郁症已成为一种常见疾病。不同年龄段面临着不同压力,大学是高中后进入的完全截然不同的下一个阶段。这个阶段中,很多学生面临着生活不适应、学业不适应、环境不适应等各种生理和心理问题。此外,大学阶段是大多数人从学生时代走向
白日与黑夜都是自然界运转的客观现象,体现着自然规律。夜具有独特性,主要表现在对人的视觉影响方面,不同于白天的强烈光线,在黑夜里或是无光,又或是仅有月光、烛光等微弱光亮。在这样的情境下,人们的视觉范围受到限定。在黑夜中人的感官感知功能被放大,身体的其他知觉便对其进行弥补,诗人作为诗歌创作的主体而受到影响。因此,受夜暮情境影响而创作的诗歌便呈现出多种多样的主题类型与表达方式。本文以魏晋南北朝夜暮情境诗
量子通信的核心是量子密钥分发(Quantum key distribution,QKD)。其安全性主要是基于量子不可克隆定理和海森堡不确定原理,在理论上满足“一次一密”加密系统的要求。在实际的应用中,QKD协议所需的理想条件很难达到,所以,进一步,在 QKD 的基础上,测量设备无关 QKD(Measurement device independent,MDI-QKD)有效的解决了针对探测器端的量子
近年来,量子通信凭借其高保密性、高效率等特质,在各大媒体中频频亮相,吸引了广泛的关注。量子密钥分发(Quantum Key Distribution,QKD)作为量子通信中的关键技术,依据“量子不可克隆定理”和“海森堡测不准定理”在信息加密方面展现了一定的优势。在QKD中,发送方将信息编码到量子态上,通过信道与接收方共享随机产生的密钥。但实际上,量子密钥分发系统和理论上存在一定的出入,从而会其传输
在“三权分置”的政策大背景下,农村的宅基地不再局限于简单的退出和收回,闲置的宅基地有了更多的利用方式和转换途径,在利用过程中,农户的意愿、地域条件和政策制度的差异很大程度上决定了宅基地的未来走向,也决定了农村新兴产业用地的实际操作中是否可行,关系到乡村产业的振兴和闲置低效资源的有效盘活利用。本文基于农户的视角,选取重庆市主城区之一的沙坪坝区边缘的4个乡村振兴示范村为调研样点区,首先在进行实地走访、