基于卷积神经网络的图像三维重构技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:ruixinxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅猛发展和不断更新,对图像数据的研究不仅仅只限于二维平面,而是渐渐涉足于三维空间。三维信息对物体的描述更具体、全面,有助于计算机去认识人类世界,完成图像分类、识别、场景理解等任务。因此,对图像三维重构技术的研究是视觉领域的基础性工作,具有重要的意义,近年来,成为图像领域的研究热点。本文以点云作为三维空间的表示形式,研究如何利用深度学习方法完成单张图像的三维重构。以神经网络3d-lmnet为出发点,分析3d-lmnet中存在的不足之处,并对其中的点云特征提取网络、图像特征提取网络提出改进方案。改进后的结果相比原始3d-lmnet在重构效果上更优,重构的模型更接近真实三维数据。本文的主要工作内容如下:本文针对3d-lmnet中用于点云特征提取的自编码器提出改进方案,优化自编码器中的两个组成部分Encoder与Decoder。Encoder部分采用两条并行线路进行点云数据的特征提取,获得潜在空间向量;Decoder部分加入上采样层支路,与全连接层支路共同完成空间点坐标的预测。改进后的点云自编码器,相比原始结构,不仅在点云数据特征表示上提高了4.27%,而且网络具有快速收敛的优势。再根据数据样本的特点,选用Leaky-Relu作为激活函数,最终使得图像三维重构的精度提高8.96%。以改进后的3d-lmnet网络为基准,研究图像特征提取网络在网络结构、输入图像通道上对重构的影响。在结构上,加入残差单元后,网络训练更平稳,网络训练时间更少;在输入图像通道数上,增加图像数据的alpha通道后,网络描述点云边界部分的能力增强,重构精度提高8.40%。探究两者的综合性能,不仅在训练时间上有所减少,而且在重构效果上也有所提升。最后,利用改进后的3d-lmnet对数据集中的每一类数据进行评估,以Chamfer、EMD为评估指标,得到的结果优于3d-lmnet。
其他文献
民族歌舞表演是边疆少数民族地区的文化旅游产品之一。通过对新疆"民族歌舞伴宴"旅游产品的开发经营现状进行实地调查,分析总结出新疆"民族歌舞伴宴"旅游产品开发的三类典型
天长纪庄木牍《算簿》是目前所见到的第一份汉代县级算赋文书,深化了我们对汉代算赋问题的认识。《算簿》中的"事算",体现了徭役承担者和算赋承担者的一致性;《算簿》中"复算
前牙即刻种植常伴有不同程度的骨缺损,常规引导骨再生技术,术中创口闭合困难,术后炎症反应明显,感染概率增加。该文报道单独应用富血小板纤维蛋白修复前牙即刻种植骨缺损,评
本文是对已经获得MHK三级合格证书的学生进行的一项效度调查研究。研究结果表明,MHK的效度较高,能够较为准确地测量学生的汉语水平。获得MHK三级合格证书的少数民族学生,进入
随着江苏沿海开发上升为国家战略,盐城市沿海滩涂开发遇到了前所未有的机遇;同时盐城沿海滩涂又是重要的湿地保护区,因此处理好保护与开发的关系,探讨滩涂的合理利用模式有着
<正>201 5年4月1日,陕西秦岭水泥(集团)股份有限公司(以下简称公司)收到中国证券监督管理委员会《关于核准陕西秦岭水泥(集团)股份有限公司重大资产重组及向中国再生资源开发
看过电影《罪恶之城》的人都知道其翻拍自漫画《罪恶之城》,漫画《罪恶之城》在每一个漫画迷心中都具有神圣地位,并将这种感染力波及到了电影导演,使得翻拍的电影完全再现了
马来西亚华语是全球华语的一部分,具有华语的共性也具有自身的特性。马来西亚华语口语里的"酱"用法复杂,具有指代事物、事情、性质、状态、方式、程度等实指功能;"酱"的虚指
当前我国民族地区文化产业发展呈现以下几个特征:一是区际区内差距较大,但整体发展速度较快;二是有效促进了地区就业与经济发展,但产业结构不尽合理;三是特色文化资源丰富,但
<正>(接上期)三、原子时标准——国际秒定义1967年,第十三届国际计量大会通过了秒的新定义为:"秒是铯-133原子基态的两个超精细能级之间跃迁所对应的辐射的9192631770个周期