基于RGB-D物体识别的深度学习算法研究

被引量 : 0次 | 上传用户:mm315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是机器学习领域一个全新的研究方向,其目的是建立多层神经网络,以期能够模仿人脑的机制来分析和解释图像,音频和文本等数据。它通过组合浅层特征形成更加抽象的高层特征,以发现数据的分布式特征表示。图像识别是计算机视觉领域最重要也是最困难的问题之一,提高图像识别的准确率对于自主式机器人的普及具有决定性的意义。深度学习在图像识别领域的成功应用进一步推动了计算机视觉的发展。基于RGB图像或者灰度图像的图像识别,虽然也取得了一定的研究成果,但是由于RGB图像和灰度图像包含信息的局限性,已经很难满足当代图像识别应用中对准确率的高要求。采用新一代传感技术的RGB-D相机(如Kinect相机)能够同时记录高分辨率的RGB图像和深度图像。RGB图像包含物体的表面颜色信息和纹理信息,深度图像包含物体的空间形状信息,RGB图像和深度图像对彼此都是一种有效的补充。如何利用深度学习技术有效的结合RGB图像和深度图像来提高物体的识别准确率成为了深度学习领域的一个新的研究热点。在本文中,我们首先提出了一个由K稀疏自编码算法和空间金字塔最大池化算法组成的深度学习模型,K稀疏自编码算法提取RGB-D图像的浅层特征,然后交由空间金字塔最大池化算法提取更抽象的高层特征。实验结果表明,此算法提取到了有区别力的特征,提高了物体的分类准确率。然后,我们提出了基于稀疏自编码算法改进的多模态稀疏自编码算法和一个新的深度学习模型,新的算法有效的完成了RGB特征和深度特征在原始图像层的融合,实验结果表明有效的融合RGB特征和深度特征比简单的连接特征更能发挥出RGB-D图像的优势,RGB-D物体的识别准确率进一步得到了提高。最后,我们首先单独的提取了多种RGB-D图像的特征,然后在决策层采用静态线性组合的方式完成了多种特征在决策层的融合。研究结果表明,在决策层对RGB特征和深度特征进行融合,也是一种结合RGB图像和深度图像的有效手段,能充分的发挥两种图像各自的优势,提高RGB-D物体的识别准确率。
其他文献
自我国实施了企业所得税改革政策之后,我国市场上的企业会计工作环境就发生了一定的转变。会计-税收差异和会计稳健性之间的关系也逐渐呈现出一种新的趋势。即当会计-税收差
新媒体作为一种新文化,已辐射到作为特殊政治文化的思想政治教育,并发生巨大影响。深入分析和理解新媒体的文化特性如人文特性、公共特性、互动特性、创新特性、控制特性,借
基于合金化的改性原理,以调整材料的长程有序度为改性思想,采用真空电弧熔炼/热压退火制备了四种Cr/Al复合合金化Fe3Si基有序合金。通过XRD,SEM,EPMA等对合金进行了表征,并采
<正>马航MH370航班失踪事件,令飞机实时监控的必要性再度成为话题。飞机监控弊端再现"利用实时卫星数据传输对飞机飞行情况作记录。这样地面上保留的备份信息,也能够帮助调查
<正>古人想象中的宇宙主宰,在殷代一般称为“帝”,周代以后则一般称为“天”.这个问题虽曾被一些古文字学家注意到了,但由于对此未作进一步的探讨与解释,加上传世文献对“帝
运用超声滚压处理(USRP)的方法,在Ti-6Al-4V合金表面制得一层Al2O3薄膜。利用SEM、XRD、光学干涉仪及显微硬度计分析了超声滚压处理后试样表面层的微观组织和性能。结果表明:
在企业"工作成就"的生产程序里,最稀有的资源就是时间,时间是一项最特殊的资源,他的供给没有丝毫弹性也完全没有替代品。德鲁克教授也指出:有效的管理者与其他人最大的区别就
如何抓好综合治理工作,创建平安城市商业银行,是我们当今建设现代化的城市商业银行的需要,也是我们抓好各项工作的重中之重。今年来,城市商业银行认真履行社会治安综合治理责