基于稀疏表示的RGB-D图像特征学习研究与应用

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:spls108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RGB-D(彩色与深度)图像分类是计算机视觉领域的研究热点之一。将彩色信息与反映物体表面三维特征的深度信息融合,可极大地提高图像分类准确率。然而,对于大规模、复杂场景的RGB-D图像分类问题,传统的特征提取方法往往需要手工设计特征,且难以提取辨别性能高的稀疏性特征,影响了分类性能。稀疏表示方法具有鲁棒性好、泛化能力和抗干扰能力强特点;深度学习能自动地对输入样本图像进行本质特征抽取,这两类新方法的出现为RGB-D图像特征提取与学习注入新的方向。研究快速、有效的RGB-D图像稀疏表示方法。将其与深度学习技术融合,提出高效的RGB-D图像特征自动学习方法,应用到水果分类识别中,不仅将极大地推动图像分类研究的进程,也将促进农业计算机视觉的应用发展,具有重要的理论和现实意义。本文以提高RGB-D图像分类准确率为目标,采用稀疏表示和深度学习理论研究RGB-D图像特征提取、表达和学习方法。在分析目前特征提取与表达的基础上,提出新的特征学习方法,并将其应用到RGB-D图像分类和水果成熟度判别中。主要研究内容和创新工作包括以下几个方面:(1)提出了基于局部约束稀疏编码(Locality-constrained Linear Coding,LLC)的RGB-D图像特征表达方法。针对经典的稀疏编码速度慢以及未考虑特征的局部性问题,该方法分别对RGB图像和depth图像提取SIFT特征,利用LLC形成RGB-D图像的特征表示。与经典的稀疏表示相比,该方法同时考虑了特征的稀疏性与局部性,更加有利于图像分类和目标识别。在水果种类分类和RGB-D数据集上验证了局部约束稀疏表示的有效性。(2)提出了改进结构化稀疏表示的RGB-D图像特征学习算法。针对RGB-D形状高相似度图像难区分问题,在优化函数中引入理想类别标记项来增强字典判别性能,采用交替方向乘子(Alternating Direction Method of Multipliers,ADMM)方法推导字典学习与稀疏编码求解,获取改进的结构化稀疏表示作为特征表示,完成图像分类。该方法在保证特征学习的稀疏性基础上,同时实现类类之间距离最大和类内距离最小约束,实现相似图像有效区分。在RGB-D数据集上进行对比实验,表明了该方法比经典的组稀疏方法具有更好的性能。(3)提出了卷积神经网络(Convolutional Neural Networks,CNN)融合组稀疏表示的RGB-D图像特征学习方法。传统的特征表示方法中,其特征提取一般使用手工设计图像局部特征,这很大程度上依靠专家经验知识,缺乏特征提取的通用性,利用CNN方法,能自动从源图像中直接提取图像的边缘,纹理和颜色特征,形成图像的全局和局部融合特征。但是,CNN学习特征冗余较大,需进一步用很少的数据捕获其中的重要信息。组稀疏表示方法结合了稀疏表示中的L1-范数约束以及岭回归中的L2-范数约束,在组间尽可能稀疏,同时保持组内尽可能小的损失误差。对比稀疏表示方法,该方法融合CNN自动学习特征与组稀疏的组效应优点,在图像分类中能获取得更好的性能。(4)提出一种基于深度学习与组稀疏的RGB-D图像层次特征学习模型。首先,采用卷积递归神经网络方法分别从源RGB和深度图像中自动提取低层和中层特征;然后,采用组稀疏编码和改进的块字典学习方法对图像特征进行深入学习,获取更具区分与判别能力的高层特征表示;最后采用softmax分类器实现RGB-D图像分类。在RGB-D数据集和2D3D数据集上进行实验验证,表明该层次特征学习方法能有效完成大规模数据集分类,对比其他特征学习方法,其准确率有明显提升,同时融合彩色与深度图像特征可显著提高图像分类准确率。(5)设计与实现自然场景下百香果目标检测与成熟度分类的系统。为了实现机器人快速的百香果适时采摘,首先采用kinect2.0设备,建立果园场景下百香果RGB-D数据库;然后对RGB图像和深度图像分别采用HOG特征和Adaboost级联方法完成百香果果实检测,其检测精度达到82.9%;最后利用彩色SIFT特征融合ScSPM、彩色SIFT特征融合LLC和CNN特征学习方法对检测出的百香果果实进行成熟度判别,三种方法中,彩色SIFT特征融合LLC方法取得最好的分类准确率(91.52%),能高效地完成自然场景下百香果果实的成熟度分类作业。通过上述的研究工作,结果表明:有效的特征编码方法,即稀疏表示方法能够极大地改善RGB-D视觉图像分类和识别的性能;基于深度学习结构的特征方法能够对原始的图像数据学习出有效的特征,避免了人工设计特征的复杂性。基于稀疏表示和深度学习的特征提取方法,在图像识别上可获得较高的准确率,是一个非常前沿的研究方向且具有广泛的应用前景。
其他文献
<正>中国80后的集体回忆,被一个复活的日本动漫形象点燃。"英雄柏勒洛丰驾乘一匹身生双翼,名为珀伽索斯的神马,斩杀了无数怪物和敌人,却因为傲慢触怒众神。于是,宙斯设计让柏
我省于2001年步入人口老龄化社会,预计2015年进入高龄化社会。人口老龄化、高龄化发展趋势的加快,对我省社会养老保障和养老服务提出了新的、更高的要求。2014年5月30日,海南
目的探索孤独症谱系障碍儿童棋盘格翻转视觉诱发电位的特点。方法采用美国精神障碍统计与诊断手册第四版(DSM-Ⅳ)诊断标准入组孤独症谱系障碍组12人;正常对照组12人。对所有
简要介绍了实验室级氯碱电解系统的设计理念和实际效果,考察了盐水中钙镁杂质离子对氯碱离子膜电解性能的影响,采用能谱仪对氯碱膜中杂质沉积情况进行了分析,利用溶度积理论对钙
为了使C02探测仪性能变化得到校正,对C02探测仪的星上辐射定标方法进行了研究。首先,利用稳定辐射源太阳与漫反射板相结合实现CO2探测仪探测器绝对辐射定标,其次,以定标灯、漫反
针对因果图精确推理是NP(nondeterministic polynomial)难的问题,提出了一种迭代推理方法。首先,从图论的角度分析了因果图推理中概率计算的机理,并提出了矩阵解环的方法。在此
背景与目的肺癌袖状切除术可以达到与全肺切除相似的肿瘤和淋巴结切除率,而且,同全肺切除相比,可以减少肺功能的丧失,改善患者生存质量。该研究旨在比较肺癌患者肺癌袖状切除
<正>养老院里,一排排房间的门敞开着,屋内的老人几乎都坐着轮椅,午后时分,他们齐刷刷被推出来坐在走廊里"放风"……记者近日前往海口一家养老院采访,被这样的一幕深深刺痛了
[目的] 探讨葛根素治疗突发感音神经性耳聋。[方法] 对1997-2003年收治的932例突聋患者随机分成两组(葛根素组、低分子右旋糖苷组)。[结果] 经高压氧微波等综合治疗多个疗程
用GeoDa软件的四分位图、Moran’s,及局域Moran指数散点图来综合描述我国能源碳排放、人均能源碳排放和单位GDP能源碳排放空间分异与局部集聚的典型事实。研究发现,各项指标存