基于深度学习的RGB-D图像分类算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:dragoonzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
3D图像分类是计算机视觉中的一个热门课题,在室内物体检测、行人检测、姿态检测和机器人视觉等领域有着重要的应用价值。随着人工智能的快速发展,基于深度学习的RGB-D图像分类方法得到广泛地关注。本文研究基于深度学习的RGB-D图像分类方法,设计并实现了一种基于卷积神经网络的稀疏连接方法用以更有效地提取RGB-D图像的特征;针对深度学习网络权值参数多、占用存储空间大等问题,实现了一种基于深度卷积神经网络的层内权值共享方法。论文主要研究工作如下:(1)阐述了基于深度学习的RGB-D图像分类研究背景及意义,概述了该技术的国内外研究现状。重点介绍了传统图像分类方法和深度学习方法的相关理论。详细分析了深度图像获取、彩色图像和深度图像特征提取、经典图像分类模型、经典深度学习网络模型等相关技术。(2)为了使网络更能针对性地提取RGB-D图像的特征、减小冗余权值的影响,本文设计并实现了一种基于稀疏连接的深度学习网络。该网络在卷积神经网络滤波器层中,利用SURF算子得到图像特征点的位置,然后以特征点为中心确定滤波器层在图像中的感受野,所得感受野与卷积核形成稀疏连接网络,构成了卷积神经网络中的滤波器组层。实验结果表明,所提方法有效地提高了图像的识别精度。(3)针对深度学习网络计算量大、权值参数多、空间消耗大等问题,本文实现了一种深度层内权值共享的网络。该网络通过自组织映射神经网络对每层网络权值进行聚类处理,然后利用聚类中心进行层内权值共享。实验结果表明,在保持RGB-D图像识别率基本不变的情况下,本文方法能对中等及以下深度学习网络进行有效地压缩。
其他文献
现在的网络管理,对网管系统的要求必须具有良好的开放性和对标准协议支持的规范,支持不同厂家不同HFC设备的能力,通过HFC网路管理系统的开放式的接口标准以及对系统的上层业务的
随着生活中消费电子产品的日益增多,人们渴求一种便捷的能容纳多个设备的家用充电平台。作为一种新兴的技术,无线电能传输(WPT)技术在供电方式上的创新备受关注。特别是磁耦合谐振式无线电能传输(MCR-WPT)技术,它是一种具有安全、简洁、中距离传输和高效率等优点的新型技术,能够很好地被应用于家庭和办公等环境中。利用该技术,充电平台能有效地给多个移动设备同时无线供电,具有广阔的研究前景。本文研究的是具有
近年来,随着无线移动通信技术的迅猛发展,用户对高带宽、高效率、高质量和低时延业务的需求不断提高,然而有限的频谱资源成为阻碍蜂窝系统性能提高的最主要因素,如何尽可能地
MIMO技术在不需要增加频谱资源和天线发送功率的情况下,可以成倍地提高信道容量;分集技术利用多条传输相同信息的相互独立衰落特性的信号路径,可以大大地降低衰落对无线通信的
当前图像处理领域,尤其是图像恢复领域,大部分算法都围绕着挖掘添加有价值的图像先验信息进行。由于相似的特征图像块或者特征图像方块之间相关性强,可以约束其构成矩阵或者
作为传统有芯电子标签的有力竞争者,无芯RFID标签因其低廉的成本将来有可能以射频条形码的形式得到大规模的应用和推广。由于在功耗、数据安全、环境适应能力等方面具有潜在的
随着数据传输需求的快速增长以及集成电路技术的飞速发展,更可靠更高效的数字通信系统已成为主流,而绝大多数的数字通信系统都会使用编码调制技术,其中应用最广泛的就是比特
互联网发展的初期,是提供“尽力而为”服务的分组交换网网络,它主要支持FTP协议、E-mail、HTTP等相对传统的数据业务,这些业务对网络时延等性能要求不高。如今,网络数据中更
信号的稀疏表示是指在给定的过完备字典中选取尽可能少的原子来表示信号。对于图像信号,通过采用固定字典或学习字典来实现信号的稀疏表示。图像的稀疏表示可以刻画图像中的
为了解决城市交通道路拥堵,有效惩治交通违停问题,在公安部应用创新计划支持下,我们基于DSP芯片TMS320DM642设计了一套智能视频监控系统,该系统能够实现对进入违停区内车辆进