基于稀疏表示和深度学习的三维物体识别研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:majian_hunu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视图是计算机视觉研究的主要对象,且内容丰富,常作为传递信息的载体。随着当下生活人工智能化的发展,基于视图形式的三维物体识别技术在很多领域都有了广泛应用,特别是在自动驾驶、医学图像分析等领域。在对物体特征信息的描述问题上,与单一视图相比,多视图可以在物体特征信息上相互补充。物体识别技术中特征提取是计算机处理识别物体的前提,如何建立优化的特征提取算法,得到更为精确、完整的物体特征信息成为计算机物体识别领域的研究热点。本文旨在解决现有方法中的问题,为有效考虑物体的整体信息、完成相关的特征提取和分类识别工作,设计了Canny算法提取物体特征稀疏表示化的识别方法以及注意力机制增强深度网络提取物体有效特征的识别方法,完成相关的实验,本文主要的研究工作如下:首先针对人工特征提取手段表征性低、程序计算量高的不足,设计了一种基于稀疏字典表示的物体识别算法,通过在虚拟摄像机的不同角度下获取一组关于物体的二维图像,鉴于经典Canny算法在提取一组图像边缘轮廓特征时存在丢失边缘特征信息的情况,为了解决该问题,本文对算法进行了改善,使其能够尽可能多地提取一组物体边缘特征信息,对初步提取的物体特征向量进行学习,在实现了对物体特征信息完整表示的同时,也可以得到对物体特征向量的稀疏化表示,稀疏表示的使用会大大减少分类识别时间。其次针对VGG模型的特点和原网络结构的不足,设计了一种基于深度学习特征的物体识别算法,通过同样的方式采集一组视图,为了捕捉相邻视图间的联系以及权重值,加入注意力(Attention)模块到网络卷积之中,该模块充分地考虑到视图的关键特征区域,可以很好地将物体关键局部特征和全部特征聚焦、显示出来,这样卷积神经网络在提取物体特征时能够较多地保留物体的有效信息,之后在融合层完成它们的特征级融合。利用该优质的物体特征训练得到优质的网络模型,后面又增加了稀疏表示分类器在测试集进行测试分类。最后,为了对我们设计的方法进行评估,实验部分选取了三维物体常见数据集进行验证,相对应的识别正确率为90.19%和94.25%。实验结果表明我们设计的两个方法在三维物体识别任务中取得了不错的结果,证明了本文识别算法在一定程度上具有鲁棒性和先进性。
其他文献
在肺癌早期利用肺结节图像帮助医生完成肺结节的发现和诊断对于病患的病情控制有着非常重大的作用。在实际医学诊断过程中,肺部CT图像数量庞大,导致影像科医生的工作压力巨大,进而出现误诊漏诊问题。利用海量肺部CT数据的肺结节检索通过查找与待诊断结节图像相似的图像来完成辅助诊断给予医生诊断意见为上述问题提供了决策支持。本文基于卷积深度神经网络,针对不同的数据类型检索需求,提出了两种肺结节CT图像检索模型,并
学位
随着不同分辨率的显示设备数量的快速增长,图像和显示设备大小的不匹配问题使图像重定向方法成为计算机视觉领域的热点问题。内容感知图像重定向方法的主要目标是改变图像长宽比的同时保护图像中的主体对象,使变形尽可能发生在相对不重要的区域。但对于具有多个主体的图像重定向时会由于显著图的不准确造成主体对象的严重失真。同时,由于目前大多数算法并没有考虑图像重定向后的美学分布,生成的图像的美学结构容易受到破坏。针对
学位
行人再识别旨在从不同摄像头检索特定行人是否曾经出现,被广泛认为是一个图像检索的子问题。行人再识别技术面临着行人图像的分辨率变化大、拍摄角度不统一、光照条件差、环境变化大、行人姿态不断变化以及存在遮挡等严峻的挑战,是一个具有挑战性的课题。无监督的行人再识别技术不使用目标域图像的标注信息,其中的域泛化行人再识别能够在源数据集训练并直接在目标数据集进行测试,具有更广泛的实际应用意义。本文针对现有域泛化模
学位
<正>河南是中华文明的主要发祥地,物华天宝,人杰地灵,英才辈出。河南南阳的桐柏是淮河之源,也是革命老区,四大文化(盘古文化、淮源文化、佛道文化、苏区文化)与桐柏秀丽的自然风光相互融合,构成独具特色的桐柏文化。刘世忠,就出生在这块文化和英雄之地。凌寒独开暗香自来
期刊
学位
步入数字经济时代,越来越多的经济行为会以线上、虚拟的方式进行。在个人所得税征管中,涉税信息同样起到举足轻重的作用。一方面,涉税信息一直是税收征管能有效进行的基石,税收信息管理能力是税收征管能力的重要方面,在税收征管现代化的道路上,必然对税务机关的税收信息管理能力提出新的要求;另一方面,涉税信息主要以电子化、数据化的新形式呈现的,在此种新变化下,为保证税务机关能够获取足够的涉税信息,产生了税收信息管
学位
数据挖掘领域中的序列模式挖掘是一个研究热点课题,而且带有周期性间隙约束可以使得挖掘更具有针对性。其中,基于无重叠条件的序列模式挖掘问题与其他同类研究相比更具有研究意义。传统的序列模式挖掘只考虑模式在序列中的出现频率,忽略了外部效用对于模式的影响,这就导致一些出现频率低但是极为重要的模式被忽略而一些出现频率高但是影响程度不高的模式被发现。这不仅降低了挖掘效率,而且使用户的可用性降低。鉴于此,本文研究
学位
19世纪,欧洲引入自由贸易规则之时恰逢工业化大发展,竞争成为市场的主旋律,但完全自由竞争带来的弊端也逐渐显现:完全自由的竞争不仅损害了竞争的公平性,也损害了诚信经营者的利益。于是,所有市场经济国家开始研究如何规范市场竞争衍生出来的不公平情形,以保护经营者的利益,由此,反不正当竞争法孕育而生。虽然各国因历史背景和法律渊源不同而采取了不同的立法技术,但是当时所有的立法都关注诚信经营者的利益,防止他们受
学位
推荐系统能够有效的解决信息过载的问题。由于数据集的稀疏性问题,传统的推荐算法采用线性映射的方式往往限制了算法的表达能力。近年来,深度学习通过引入非线性变换成功推动了图像处理等领域研究的进展,与此同时,在推荐系统领域通过引入深度学习也取得了一定的研究成果。本文针对数据稀疏性导致的推荐算法的精准度不高的问题,提出了两种基于深度自编码器神经网络的个性化推荐模型:1)融合用户以及项目特征的双卷积自编码器神
学位
随着卫星遥感技术的快速发展,遥感图像在城市规划、农田规划、自然灾害处理等领域起到越来越重要的作用。语义分割是遥感图像处理中的一个重要任务,而基于深度学习的遥感图像语义分割任务需要为每个像素点标注,这个过程会耗费大量的人力物力。为了缓解遥感图像标注压力,通常采取数据迁移的方式,即在一个有标注的数据集上训练模型,在未标注的数据集上应用。由于不同遥感数据集之间存在较大的差异,导致了训练测试过程中出现域偏
学位