基于深度数据和图像语义分割的三维场景重建技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hudaye1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,三维场景重建的研究越来越得到重视,使得三维数字地图等技术获得了蓬勃发展。三维场景重建是当今计算机视觉研究中备受关注的研究方向。随着深度相机的普及,基于深度数据的三维场景重建已经取得了非常大的进展,可以定位在一个场景中的位置,最终获得一个完整的三维模型。伴随着深度学习的快速迭代发展,基于卷积神经网络的图像语义分割也收效显著。图像语义分割可以对图像进行像素级的分割,所以将其应用于基于深度数据的三维场景重建中,可以获得带有简单语义分割的三维模型。本文将基于卷积神经网络的图像语义分割应用于基于深度数据的三维场景重建中,对相关关键技术进行了深入的研究。在基于深度数据的三维重建模块中,提出了基于稀疏特征匹配和稠密光度匹配的位姿优化策略,在几何优化和光度一致性优化的基础上,融合稀疏特征优化项,并在标准数据集上进行实验,验证了优化后的效果。在基于卷积神经网络的图像语义分割后端处理模块中,优化了条件随机场二元势函数,大量的实验证明分割效果得到改善。基于上述技术本文提出基于深度数据和图像语义分割的三维场景重建方案。通过深度数据获取三维模型,通过图像语义分割获取图像像素级语义分割,并通过基于贝叶斯的渐进式标签迁移策略,把预测的语义分类标签迁移到重建的三维模型中,最终生成带有简单语义分割的三维模型。为了获得带有简单的语义分割的三维模型,本文采用了结合图像语义分割和深度数据的三维场景重建方案,但是还有很多不足,仍然需要继续改善,本文最后也对后续的完善和拓展工作进行了展望。
其他文献
近年来,随着容错技术的发展,软件容错技术作为一种提高软件可靠性的重要方法越来越引起关注。软件容错的主要技术包括:基于重复指令的错误检测技术(EDDI),基于数字签名的控制流检测
随着互联网科技的发展,人工智能在教育领域得到了广泛的关注与应用。通过机器解答数学应用题从而帮助学生提高解决问题的能力也是当前研究的热点,从更大范围上讲,教育机器人
近年来,由于互联网及多媒体技术的飞速发展,使得人们所接受的大部分信息是图像或视频信息,但是由于图像的底层特征与高层语义之间存在着一条难以逾越的鸿沟,视频字幕提可以有效获
随着现代教育技术和人工智能技术的迅速发展,对学科题目机器解答的研究再一次变得火热起来。相较于其他学科,数学是一门以数量和关系为基础的学科,研究数学题目的机器解答是
粒子群优化算法是一种基于群体搜索的智能优化算法,是一种以数学为基础,应用于求解各种组合优化问题的新型技术。近十几年来,粒子群算法受到越来越多学者的关注。由于算法设置参
井喷式增长的新闻网页造成大量新闻资源堆积在互联网上,由于这些新闻资源的异构性和缺乏统一的规范,无法使用传统的数据库技术进行处理,导致这些聚集在互联网上的新闻资源只
学位
宽带光纤无线(ROF, Radio over Fiber)技术利用光纤链路传输高频率无线信号,融合了光纤通信的高容量、低损耗和无线通信的高效灵活性等优势,受到了广泛的研究。同时正交频分复用(O
传统节日作为非物质文化遗产的重要部分,是人类非常宝贵的精神文化财富。随着社会节奏的不断加快,在全球化和现代化进程中,传统节日习俗在保护和传承中遇到了许多的问题,保护
民航的快速发展对经济和社会发展发挥着巨大的推动作用,但是航空器噪声污染问题严重影响民航的可持续发展。物联网技术的应用与发展为机场噪声细粒度的监测提供了可能。随着民