硬件友好的高精度立体视觉图像匹配算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:youare2b2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度信息在车辆自动驾驶系统、机器人导航、三维重建等计算机视觉任务中发挥着非常重要的作用。立体匹配是一种经济便捷的从多个视图中获取深度信息的技术。高精度的匹配算法往往会消耗大量的计算资源和较长的运行时间。为了在资源有限的硬件平台上实现实时的立体视觉系统,设计硬件友好的高精度匹配算法具有重要意义。本文针对实时的高精度立体匹配算法开展研究,主要工作如下:(1)面向基于半全局匹配的深度信息估计算法,本文设计了一种两周期分时复用的资源高效的流水线硬件架构。其中对输入图像进行降采样处理来提升系统吞吐率,跳列、代价量化等策略来减少硬件资源消耗,并提出加权路径代价聚合来提升算法精度。基于Zynq-7 FPGA对所提出的架构进行了性能评估,在200MHz频率和128视差范围下系统的吞吐率可达到1280×960@1 16Hz,MDE/s 为 18245。(2)基于卷积神经网络,设计了一种端到端的立体匹配网络,FPN(Feature Pyramid Network)-Net。在网络中引入ResNet网络来提取特征,并利用特征金字塔网络进行多尺度信息的融合。为了更加充分学习上下文信息,设计了具有编解码架构的沙漏堆叠的网络进行代价聚合。在KITTI2015测试集上视差图的平均误匹配率为1.93%,在现有公开算法中排行第7。(3)为了使FPN-Net更加硬件友好,几种模型压缩的方法被用来降低网络模型参数、减少浮点运算次数以降低庞大计算和存储需求。主要包含特征提取模块的网络层数压缩,三维卷积网络的紧凑型网络设计。参数减少了 75.9%,FLOPs减少了 58.9%,在KITTI2015测试集上误匹配率仅增加0.42%。对网络中的权重和偏置等参数,进一步提出定点化策略,将网络模型的存储量降低了 74%。实验结果表明,基于半全局匹配算法设计的硬件架构在资源与精度之间取得了很好的均衡。基于CNN实现的FPN-Net与其他端到端网络相比,通过特征金字塔网络和沙漏网络加强对上下文信息的学习,在相当运行时间下可以获得更加精确的视差图。针对FPN-Net,所使用的模型压缩方法能够极大的减少冗余参数和浮点运算次数,参数定点化可以进一步降低模型存储要求。
其他文献
大数据时代,物联网快速发展,信息和数据在网络中高效快速的传输。这极大地推动了社会进步、改变生活方式,同时这也引发了一系列信息安全问题。数字签名作为一种重要的密码学
乳腺癌是最常见的一种癌症,也是女性癌症死亡的主要原因,早期筛查对乳腺癌防治至关重要。自动全乳超声(ABUS)是乳腺癌筛查的一种新的有效的影像学检查手段,与传统手持式超声
目标跟踪是计算机视觉研究中一个重要内容,在智能监控、自动驾驶、医疗诊断等各个领域中都有着广泛的应用。然而实际的跟踪应用面临各种复杂环境场景,仍然存在许多问题亟需解
分析师是否具备预测公司未来业绩的能力对参考研究报告做出决策的投资者来说是十分重要的问题。至今,关于分析师预测能力的证据大多是基于分析师发布的盈利预测和投资建议。
波长选择开关(WSS—Wavelength Selective Switch)是新一代可重构光分叉复用(ROADM—Reconfigurable Optical Add/Drop Multiplexer)光网络中的核心器件之一。基于硅基液晶(L
眼机交互是目前人机交互技术中具有前瞻性研究价值的新方向,目前已逐步应用在虚拟现实、残疾人辅助、医疗、教育和军事等诸多领域。近年来,越来越多的设备将眼机交互的方式加
当今,癌症是威胁人类生命的一大杀手。随着第二代测序技术的发展,产生了海量可用的基因表达数据。虽然,这类癌症数据包含丰富的基因表达信息,为科研工作者从分子水平揭露癌症
伴随现代计算机网络技术、通信技术的高速发展,如今船舶机舱模拟器的研制也日益更新,逐步完善。在当代轮机模拟器中,各项技术不断发展,利用创建三维模型,结合虚拟现实等技术,
本文开展了纳米流体燃料液滴在静电场中脱落及破碎特性的研究。采用微泵控制流量、高压静电发生器控制电压,采用氙灯光源进行透射照明、高速摄像仪采集图像等,搭建一套纳米流
步态识别是一种新兴的生物特征识别技术,与传统生物特征识别技术相比具有非接触性、远距离识别、难以伪装等优点,得到了广泛的关注与研究。但是在步态识别过程中的影响因素也