一种新型图像拼接压缩系统设计

来源 :天津大学 | 被引量 : 0次 | 上传用户:yun_breakcode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的发展,各领域对大视场高分辨率图像的需求日益提高。单幅图像在大视场和高分辨率之间的矛盾,可由图像拼接技术通过将有重叠信息的多幅图像拼接为一幅图像而有效解决。然而拼接结果图像相较于原始图像,在信息总量上有明显的增长,从而导致存储图像所需的存储资源或传输图像所需的带宽资源也急剧增大,不利于对图像的实时处理。因此,如何实现图像的实时拼接与压缩具有非常重要的研究意义。为满足上述需求,本文设计一种基于FPGA的新型图像拼接压缩系统,从而实现在满足大视场和高分辨率的同时对图像数据进行有效的压缩,便于后续的传输与存储。图像拼接部分采用SIFT算法作为核心配准算法,作为局部不变性特征描述算法中性能最佳的算法之一,该算法配准性能优秀,但存在结构复杂、处理速度慢的局限性。本文首先针对该问题对SIFT算法各模块进行合理简化和并行设计,包括简化的二维高斯滤波模块、基于同心圆邻域的特征点描述模块等,降低了算法复杂度,实现了处理速度的提升。其次,本文通过多路并行的特征点匹配模块提高匹配速度,并通过简化的单应性矩阵降低了RANSAC算法的运算复杂度。最后,对基于双线性插值和加权融合的图像融合算法进行电路设计,有效消除了图像间的拼接缝。至此,实现了从图像配准到图像融合的拼接全过程。对于图像压缩部分,本文选取JPEG2000标准进行实现。作为新一代静态图像压缩标准,JPEG2000拥有压缩比高、有损压缩与无损压缩均可支持的优势,但高复杂度严重制约了其编码速度。针对该问题,本文对其核心计算模块EBCOT Tier-1编码器进行了重点优化设计,提出压缩上下文的数据组织方法,并通过新型PET存储方式在简化逻辑的同时减小存储的Qe位数,从而减小了Tier-1编码器的硬件资源消耗;同时采用4路Tier-1并行工作的设计,大幅提升吞吐率。本文设计的系统在Xilinx Kintex-7 KC705开发板上进行测试。结果表明,系统在实现图像连续实时拼接的同时,也实现了对结果数据的有效压缩。系统对两幅640×480分辨率图像拼接与压缩处理的帧率可达30fps以上,满足了实时拼接与压缩的要求,具有较高的应用价值。
其他文献
细粒度图像具有类间差异小,类内差异大的特点,如何提取具有高辨识度的细粒度特征是解决细粒度图像分类问题的关键。小样本学习旨在通过一张或几张实例来学习和理解新的类别,但由于训练样本数量有限,很难学习到有效的特征分布。因此,开展基于小样本学习的细粒度图像分类技术研究,旨在通过有限的样本学习细粒度图像特征,进行图像分类和识别,是一项非常具有挑战性的任务。现有研究范式针对小样本条件下细粒度图像分类网络表征能
学位
高动态范围(High Dynamic Range,HDR)图像相比于标准动态范围(Standard Dynamic Range,SDR)图像,在单通道上使用更多的比特数来记录灰阶的变化,使记录的场景中明暗区域细节的可见性都有极大的提升。在目前HDR显示器还未普及的情况下,色调映射算子(Tone Mapping Operator,TMO)可以将HDR图像转为SDR图像,使HDR图像所记录的场景效果能
学位
随着新材料技术和仿生电子学等学科的飞速发展,在小尺寸区域达到高空间分辨率的测量能力成为仿生触觉感知技术需要不断提高的难点之一。以光纤作为传感元件的光纤传感技术因具有系统易于搭建、成本低、灵敏度高、探测范围广、不需额外供电和不受电磁干扰等优点,使其近些年成为重点的研究方向被广泛应用在物理、化学和生物医学等学科领域。本文以PMMA-CFBG为传感元件,提出了一种高空间分辨率的分布式传感方法并进行了理论
学位
人体姿态估计是计算机视觉任务之一,在安防监控、动作识别和动画等领域具有广泛的应用前景,近年来逐渐成为研究热点。相较人工提取特征的方法,基于深度学习的人体姿态估计方法具有更强的特征提取能力,已成为姿态估计任务的主流研究方向。当前姿态估计算法性能已达到较高水平,但是许多高精度算法依赖复杂的神经网络结构,存在计算成本高、延时大的问题而难以做到实时检测,所以需要设计更轻量的网络。本论文主要工作如下:第一,
学位
基于深度学习的智能无人系统以其高智能、小型化、低成本等优势被广泛应用于各类暗光场景。而高级的计算机视觉任务,如目标检测,通常以内容清晰的高质量图像作为研究对象,对环境复杂、光线微弱的暗光场景无法实现高精度的检测。为此,本文提出了一种融合注意力机制的暗光增强算法以及适用于移动设备的快速目标检测算法,并通过级联的方式解决了暗光检测问题。此外,为了验证算法的可行性,本文还搭建了无人车实物平台,实现了对暗
学位
近年来,随着计算机视觉采集技术及三维建模技术的快速发展,三维模型因其空间信息直观、承载内容丰富,逐渐被应用于各个领域,如建筑模型、医疗模型、游戏模型等。三维模型数据的海量增加对数据的智能管理带来了极大挑战。面对海量三维模型数据,如何实现高效地查找和复用成为业内一个亟需解决的问题。本文在对目前主流的三维模型检索和分类算法进行充分调研的基础上,针对三维模型多视图信息的表征,从自监督和无监督方面完成了以
学位
随着智能多媒体技术的发展,三维模型被广泛地应用在智能建筑、生物建模、医学诊断等领域。三维模型能更形象地表示物体、贴近人类对现实世界的感受,但其数据处理过程相对复杂。作为三维模型研究领域的热点之一,三维模型识别旨在学习三维模型数据的特征表示、理解三维模型的内容。三维模型可由不同模态数据表示,如点云、多视图等。本文以有效融合点云和多视图两模态特征表示为目标,开展了基于深度学习的三维模型识别研究。本文提
学位
伴随着近年来数字多媒体技术的发展,数字图像已然成为了信息化社会中的重要组成部分。然而数字图像在采集和传输的过程中,受到传输条件与设备固有属性等因素的影响,将会不可避免地发生失真现象,给后续的处理与应用带来很大不便。因此,设计具有高准确度的图像质量评价方法对于数字图像处理技术在其他领域的发展具有重要意义。受视觉注意力机制的启发,本文提出一种基于视觉显著性策略与多级特征融合的无参考图像质量评价方法。该
学位
水下光学图像是人类获取海洋信息的重要载体。光在水中传播的过程中,由于水对光的选择性吸收作用、水中微粒对光的散射作用,水下光学图像通常出现颜色失真、细节模糊、低亮度和低对比度等退化现象,这在很大程度上影响了水下图像在军事科研和工程项目中的应用。因此,面向水下图像进行清晰化处理研究具有重要意义。针对上述研究任务,本文主要进行以下两项工作。针对水下图像颜色失真和低对比度的问题,提出一种融合CIELab颜
学位
行人重识别是计算机视觉领域内判断图像或者视频中是否存在特定行人的技术,即给定一个行人目标,检索跨设备下的该行人图像。行人重识别作为一种复杂的目标检索任务,需要大量的训练数据集。由于生成对抗网络(GAN)可以利用输入信息生成新的图像,研究者们利用GAN进行数据集扩充或者生成特定的图像以解决行人重识别问题。但是与数据库中的原图相比,生成图像质量较低,如果直接用来训练特征学习模型,对于分类准确性的提高是
学位