双目视觉中半全局匹配算法的硬件架构研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:q18198837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉的重要分支,立体视觉广泛应用于生物医学、自动驾驶、人机交互等嵌入式应用。通常,立体视觉系统包含摄像机标定、图像校正、立体匹配和三维重建四个部分。立体视觉系统根据双目摄像机从不同角度拍摄的两幅图像,经过一系列处理,恢复出物体深度信息。由于拍摄场景受到光照、噪声、反光、透视失真、遮挡、重复和低纹理的影响,立体匹配成了整个系统最重要和最困难的部分,匹配精度直接影响了三维重建的效果。另外,在保证匹配精度的前提下,对高分辨率图像的实时处理是实际应用的基本需求。本文提出了一种基于加权半全局聚合的高精度、高吞吐率的视差并行、行并行的全流水线架构,并搭建了基于FPGA的硬件架构和验证模型。主要贡献如下:(1)提出了一种基于半全局立体匹配的高精度、高吞吐的硬件架构。整个架构包含64个视差并行计算、相邻两行像素并行计算和五条路径代价并行计算。采用乒乓缓存和分时复用的特定结构,来实现半全局聚合模块的全流水线设计,提升整个架构的吞吐率。(2)通常的半全局算法软件实现选取8或16条路径来进行代价聚合,但是由于部分路径不符合数据流向,需要消耗大量的资源来存储中间数据,现有的半全局硬件实现以降低精度为代价将路径数目降为4条。本文在不使用外部存储器的情况下,提出了基于五条路径聚合的自适应路径加权的半全局硬件架构,实验结果表明,视差图精度提高了 3.69%。(3)为了提高视差不连续区域的精度,本文在平滑约束的惩罚因子计算中,对参考图像进行拉普拉斯边缘增强。另外,在视差优化阶段,增加了碎片去除模块来消除视差图中的异常值,并采用修正的等角插值方法进行亚像素插值,提高三维重建的精度。(4)完成了该架构基于FPGA的硬件验证,采用Middlebury测试平台提供的图像对进行匹配精度测试,平均错误率为6.03%。该架构在Altera公司StratixV FPGA上的最大工作频率为156MHz,最大视差范围为64,吞吐率为1280 × 960/197fps(帧/秒)。在Xilinx公司的VC707开发板上工作频率为100MHz,吞吐率为1280 × 960/126fps。但是由于特制的乒乓缓存结构,消耗了大量的片上存储资源进行数据缓存。综上所述,该架构完全满足嵌入式应用高精度、实时性要求。
其他文献
学位
我国的房地产市场经历了拿地即赚钱的黄金时代,现已步入平稳发展期,房地产市场竞争愈加激烈,利润空间不断压缩,盈利能力减弱.房地产企业不但要发挥自身经营优势,创新设计,不
全面预算管理在现代企业管理中得到越来越广泛的应用,供水企业也逐渐将全面预算引用到经营管理中,在全面预算管理实施过程中也面临一系列问题.本文从供水企业的角度,通过阐述
学位
当前,经济发展全球化趋势加急,国内经济增速放缓,国外风险挑战明显上升,贸易保护主义抬头.为了控制企业可能存在的风险,相继产生了内部控制、风险管理等框架.对烟草行业而言,
近年来人工成本急剧上升,而人们在生活品质、生产效率等方面又有着更高的追求,使得以室内移动机器人为代表的移动机器人在人们的生产生活中扮演了重要角色。而导航又是移动机器
随着国有企业的不断改革及发展,为了适应不断发展变化的社会经济环境,需要不断优化国有企业管理,充分发挥全面预算管理的作用,整合企业的资源,统筹规划、合理分配,从而提升企
输配电线路及其附属设备的安全运行对国家经济的发展,社会秩序的维系和人民生活的幸福起到重要支撑作用。随着国家电网体制改革,电力设施越来越多,越来越复杂,同时,国民的需求也在不断提高。电力巡检是保障电力设施安全运行的重要方式,由于信息化程度低,技术水平不足,传统的巡检方法在人员管理、信息记录、路径规划等多方面暴露出许多问题,无法保障电力设施的安全稳定运行。首先分析了国内外电力巡检的研究现状,结合电力巡
随着控制对象的日趋复杂化,系统需要实现的控制功能日益多样化,这些都对多维系统的研究提出了新的要求。多维系统能全面、精确地描述多个系统参数,实时反映出各种影响因素的变化
伴随我国医疗体制改革的不断深化,医用耗材与药品加成陆续取消,医院实施分级诊疗制度,施行医保支付体系,加强内部精细化管理,控制相应成本的支出,大大增加了医院的运营负担.