基于光场的景深实时计算

来源 :东南大学 | 被引量 : 2次 | 上传用户:hjkl00000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能时代的到来,计算机视觉越来越受到人们的关注。立体视觉作为计算机视觉中关键学科,在自动驾驶,军事航天,医疗,人机交互,VR/AR等领域都有着极为广泛的应用和发展空间。在立体视觉中最需要解决的问题是准确实时提取出场景的深度信息,并进行三维场景的重建。而景深的实时准确计算一直是立体视觉领域中的难点和核心技术,所以研究景深的实时准确计算具有十分重要的价值。光场包含了空间中所有光线的辐射度信息,利用光场相机采集的4D光场数据包含了空间中光线的位置和角度信息,因此可以从光场数据提取出更多的场景深度信息。本文通过稀疏光场相机阵列采集到光场数据,在进行相关的预处理后,利用提出的立体匹配算法在Linux系统上利用GPU并行计算实现场景深度信息的实时计算,并利用计算出来的视差图实现了场景的三维重建。本文首先概述了相关的技术背景,包括了光场理论,立体视觉系统,以及GPU并行计算等方面,并介绍了相关技术的最新研究进展和应用情况。本文对采集稀疏光场数据的双目相机进行标定,通过标定得到的相机的内外参数对图像进行极线矫正,同时详细分析了立体视觉系统的几何成像原理和空间坐标关系。然后介绍了基于GPU的景深实时计算算法。本文利用GPU的CUDA架构进行景深的实时计算,为了在低纹理和复杂光照环境下具有良好的鲁棒性,我们选择Census Transform相似性测度函数进行代价计算,使用8条路径的半全局匹配算法(SGM)进行代价聚合,窗口大小为9*7个像素大小,与其他方法相比,其具有计算量小同时匹配误差小等优点。利用WTA(winner take all)策略选择像素点视差值,再利用左右一致性检测和引导滤波对视差图进行视差精化,有效提高了立体匹配算法的精确性和效率。最后利用得到的视差图和场景深度信息的三角关系进行三维场景的重建。本文在NVIDIA GTX 1080显卡上,进行1920*1080分辨率图像景深计算,能够到达30fps以上的速度。
其他文献
在建筑施工中,内业资料管理具有重要的现实意义,文章结合具体实例,通过调查分析,阐述了建筑施工中“内业资料”管理存在的问题并进行了分析和提出了解决措施。
发源于零售业的特许经营模式,现在已渗透到金融服务、房产、汽车、教育等五十几个行业,中国的特许经营起步较晚,至今只有近20多年的历史,但中国的特许经营起步较高,而且中国
本文介绍了利用Matlab工具箱开发具有友好灵活界面的电力传动与自动控制系统仿真平台,可供学生选择不同仿真环境一自行设计或给定实例仿真等。根据设定不同的仿真任务,此平台可
人类周围的真实世界是三维的,我们在生活和工作等场景需要借助三维信息对事物进行充分地理解和精确地判断。然而,传统的平面显示器只能向观看者展示二维平面信息,丢失了深度
在人类政治文明史的漫漫征途中,从来没有任何一个概念像“民主”那样引起普通百姓、政治家和有代学者的同时关注和深刻思索。百姓对民主的关注不仅诠释着“民”的基础诉求和
本文首先就我国对外贸易的演化历程进行了比较静态分析,印证了诺思“国际贸易由制度启动”的命题,从而为后文相关因子的抽象分析提供了客观贸易演化史的现实土壤。在此基础上
20世纪90年代以来,全球制造、敏捷制造、虚拟制造等先进模式不断涌现,企业组织形式以动态联盟为新的特征。原有的单枪匹马的企业竞争模式已不适应经济发展的新需求,企业需要组建
随着科技的日益进步,国际分工的进一步深化,资源在世界范围内配置,人类的生产能力不断提高,我们的经济已经走过供给约束时代,阔步在需求约束的大道上。约翰·穆勒(John Stuar
福克纳的短篇小说《艾莉》塑造了两位个性鲜明的女性人物 ,她们飘忽不定的命运、面对社会和经济变化的严酷现实所进行的呐喊、抗争抑或屈从 ,也正是美国南方的历程的缩影。《
随着认知科学的发展及其在许多学科领域的广泛普及,融合了哲学、心理学、语言学、教育学及其相关交叉学科合理内核的外语教学理论也得到了革命性的发展和完善,从传统的外语教