基于机器视觉的目标识别与抓取策略研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:justinviva
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,人类越来越离不开智能化的机器人,研究具有较高智能化的机械臂抓取方式的热度一直居高不下。在工业生产中,难免会遇到工件摆放随意,重叠、杂乱无章等情况,那些传统的视觉识别技术无法在这些环境下精准的识别到工件,所以研究出一种在复杂环境下的视觉识别方法就显得格外重要。本文首先研究了当下较热的目标检测算法在视觉识别方面的优缺点;并基于特征点算法与RGB颜色空间结合的方式提出了新的物体识别方式;最后结合机械臂设计出机器人抓取系统,它可以自行判断待抓物体的位置,并实现抓取和放置动作。主要工作包括:基于深度学习的目标检测实验、机械臂的运动学建模与仿真实验、基于单目视觉的目标位姿检测、抓取机器人系统平台搭建与实操检验等。基于深度学习的目标检测实验包括:选择两种使用面比较广的目标检测算法,本文选择的是YOLOv3和Faster R-CNN两种算法来训练目标模型,通过对相同数据集的训练与预测实验对比,比较两个算法的检测成功率与训练速度等,分析其各自利弊,并加以改进,选择适合工业生产中应用的目标检测算法。机械臂的运动学建模与仿真实验包括:通过三维绘图软件绘制六自由度机器人模型,将其导入到仿真软件进行运动学建模与正逆运动学求解,利用三维可视化工具绘制出机械臂在直线轨迹规划与圆弧轨迹规划下各关节角度的变化曲线,分析其在两种运动状态下的优缺点。单目视觉的位姿检测实验包括:比较眼在手上与眼在手外两种标定方法优缺点,选择眼在手上的摄像头标定方法;同时进行计算各种坐标系的转换关系;采用Tasi的RAC标定法进行摄像机标定;通过实验验证了基于单目视觉的位姿计算的准确性。抓取机器人系统平台搭建与实操检验包括:搭建机械臂硬件设备及软件操作平台,完成其相比于传统抓取方法在物体识别、定位、抓取、摆放等环节有效性的实践验证。本实验为目标检测算法在工业生产中的应用提供了理论基础,基于目标检测算法的机械臂抓取消耗成本较少,环境适应性较强,同时机械臂抓取的成功率也较大。
其他文献
社会的发展带动着信息数据的高速运转,为了能更加直观、生动的获取我们所需的信息,数字图像进入了信息载体的“主流”之中。并且随着科技发展不断的推动,数字图像已经以不同形式在教育、医疗、通信、智慧农业、通信等方面发挥着极为关键的作用。快速的发展也带来了一定的弊端,尤其是图像的清晰度问题,使得对于真实信息的获取受到了一定的阻碍。在图像的采集和传输过程中,由于外界环境以及传感器本身的影响,图像会不可避免受到
随着经济发展,社会文化水平提高,文化馆的全民艺术普及事业也开始步入了类似于社会经济"中等收入陷阱"的阶段,传统的文化服务模式已经越来越不适应人民群众对于公共文化服务的要求,文化馆必须进行供给侧结构性改革,引进社会力量,创新服务机制,由传统性文化馆转型为现代型文化馆,以新的模式,继续推进全民艺术普及。
手势是一种多方面的通信方式,在非语言交流和人机交互中扮演着重要的角色,它们为人机交互(HCI)提供了一种具有吸引力的方案。其中最开始的交互方式,是通过数字手套,生物肌电,kinect深度设备等外接硬件,逐渐发展为基于计算机视觉算法的方式,深度学习的最新进展极大地提高了图像识别的性能,这种方式脱离硬件设备,符合人们方便快捷的使用习惯,但是在手势变化、光照变化或背景复杂的不利现场情况下,手势识别仍然存
(1)随着5G新空口信号处理技术和超大规模MIMO(Multiple Input Multiple Output,MIMO)密集组网用户技术的广泛运用,当前通信系统中信道传输容量及信号调制技术方案不易匹配超高密集组网应用场景。本文在大规模多输入多输出(MIMO)通信系统背景下,对基于卡尔曼滤波算法下的滤波器组多载波技术FBMC调制技术方案进行研究。因FBMC调制技术方案在超大规模MIMO密集组网和
空间众包是指任务执行者前往特定地点完成众包任务,该工作模式已被大众广泛研究使用。空间众包工作模式包括工人招募与任务分配两个环节。工人招募中工人用户向服务器提交个人位置信息进行注册时会存在具体位置隐私泄露问题;任务分配环节中空间众包服务器通过任务分配算法将任务派发给工人用户,会存在工人区域位置隐私泄露以及时间开销过大的问题。针对以上众包工作模式存在的问题,本文所完成的工作包括以下内容。(1)研究直接
图像的语义分割是指根据语义信息识别出图像中对应物体的类别和位置,是计算机视觉领域的研究热点之一。相对于传统的图像分割算法,基于深度学习的分割算法不仅能自动的进行特征提取,还可以进行端到端的训练,分割精度和速度均有所提升。然而,由于室内场景的复杂性,室内场景的语义分割仍然极具挑战。随着深度相机的出现和发展,研究者们开始利用深度信息提高语义分割的精度。在这种情况下,本文针对室内场景的语义分割算法进行了
增强现实技术将虚拟信息与真实环境进行融合,实现虚拟信息与真实环境在光照、几何和时间方面的一致性,增强人类对真实世界的感知。增强现实技术的几何一致性需要确定移动设备在现实世界的位置从而准确添加虚拟信息。视觉定位技术具有高精度和无需部署设备的优点,可以实现对移动设备的实时定位。目前传统视觉定位技术在光照强烈变化的情况下存在检索失败与检索速度慢的问题,本文针对该问题做了如下工作:1.针对传统视觉定位方法
随着互联网技术的发展,为了解决图像在信道传输过程中产生丢包或者误码失真的问题,多描述编码(Multiple Description Coding,MDC)作为解决上述问题的一种抗误码传输技术,能有效的提高数据传输过程中的鲁棒性。近年来,由于深度学习方法在计算机视觉领域上表现突出。因此,本文将深度学习与多描述图像编码方法相结合,分别以小尺寸图像和大尺寸图像为研究对象,提升边路图像重建质量和中心路图像
室外实弹打靶射击训练是军队和武警部队的必备训练项目,然而训练靶机很多都是采用机械固定靶机、机械式移动靶机、机械式升降靶机,这些都只是实现了单一的训练模式。根据军队的要求,一些射击测试需要射击移动目标。出于安全原因,在打靶射击测试期间,任何人员都不能出现在正在移动的靶机附近。因此,必须使用远程实时控制来实现对靶机的移动方向和速度的控制。同时,为了及时获得打靶射击测试的结果,必须从后方控制台获取靶面的
我国多数矿井为高瓦斯矿井,煤与瓦斯突出事故一直是抑制我国煤矿安全高效开采主控因素之一。目前瓦斯抽放是防治煤矿突出事故的根本性措施,但由于我国地质构造极为复杂,加之深部煤层具有地应力和瓦斯压力大、煤层透气性差等特点,导致瓦斯抽放效果并不理想,普遍存在抽放率低、抽放困难等问题。针对以上情况,本文提出了利用电热高温促进煤层瓦斯解吸,通过钻孔将其排放至密闭巷道区域内,最后采用抽放管路将瓦斯从巷道内抽出的新