三维点云数据压缩与质量增强技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:SB502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维点云因其强大的三维空间表征能力,近年来被广泛应用于如自动驾驶、数字博物馆、机器人、医学等领域。三维点云是可由三维扫描设备或摄像机等获取到的能够描述物体表面特征信息的由海量点组成的集合,每个点一般包含几何位置及颜色信息,且点和点之间不存在拓扑关系,没有顺序,因此能否通过有限的网络带宽快速的将三维点云数据传输到用户终端中是解决三维点云数据能否实地使用的先决条件,如何有效的对点云数据进行压缩成为解决这一问题的途径之一,而有损压缩后的数据会存在不同程度的失真,给人较差的视觉效果,因此为了提高有损压缩后的三维点云质量,对三维点云数据的质量增强工作进行研究,具有重要的意义。
  本文针对点云数据量庞大以致难以在有限的带宽内进行有效传输的难题,首先研究了基于压缩感知以及基于下采样编码-上采样重建策略的三维点云压缩技术;然后,以基于几何的点云压缩(Geometry based Point Cloud Compression,G-PCC)平台作为编码框架,提出了基于深度学习的三维点云数据质量增强方法。本文的主要工作和成果如下:
  1.深入了解点云数据的获取方式,并分析三维点云在获取并实际使用的过程中所存在的问题以及相对应的处理方法。
  2.分析研究了常用的点云压缩算法,提出了基于压缩感知和下采样编码-上采样重建策略的三维点云数据压缩算法。首先研究了压缩感知算法,并通过分析三维点云数据的分布特点,将三维点云数据处理成信号然后使用压缩感知算法对其进行“压缩采样”与重建;实验中为了更好的挖掘信号的稀疏表示,采用K-SVD算法学习过完备字典,在该过完备字典上,每个序列的信号都有很好的稀疏表示;实验结果表明该算法在减少可编码比特数的同时对原始数据有较好的恢复效果。然后研究了基于采样的压缩算法,通过分析现有采样算法的不足之处后提出我们自己的一套基于下采样编码-上采样重建策略的压缩算法,实验证明我们的算法在保留原有点云数据量的前提下能够有效地重构出原始点云形状,这一算法对沉浸式体验三维点云视频传输具有重要的参考意义。
  3.针对G-PCC三维点云几何无损颜色有损编码之后的序列,提出了一种基于深度学习的质量增强算法。首先,将有损编码后的序列分patch,并提取每个patch中点的亮度分量信息,然后将每个patch中的数据按照自定义方式排列成二维的形式,最后送入我们设计的神经网络中进行训练。同样地,在测试阶段,对于一帧点云数据,首先将其分成若干个patch,然后提取出每个patch中的数据送入到已经训练好的网络模型中得到质量增强后的数据,最后对实验结果进行分析。大量的实验数据表明,我们的算法能够从有损压缩后的数据中较好的恢复出原始点云数据,有效地提高了重建数据的质量。
其他文献
明确肺结节的良恶性病理类型,对制定精准有效的诊疗方案至关重要。基于深度学习的辅助诊断方法可以减少对医生个体经验和工作状态的依赖,提升诊断效率。然而,现有的公开数据集中鲜有经病理学确认的肺部CT影像数据,无法保证样本标注的准确性和可信度。为更好满足临床需求,依据本课题组从合作医院、研究所采集的经金标准确认的肺部CT影像数据,开展了基于3D多分辨注意力胶囊网络的肺结节良恶性多种病理类型辅助诊断方法研究
医学图像配准是临床医学研究中处理医学图像信息的关键技术,传统方法主要依赖于医生人工标识的特殊标记物作为关键点来指导图像配准,但是该过程复杂而冗长,较为依赖医生经验,容易出现错误。随着数字图像的不断发展,传统方法已经无法应对越来越多的高精度医学图像。因此,使用深度学习(Deep Learning,DL)网络进行医学图像配准逐渐成为研究热点,其中针对高精度数字图像的配准方法研究主要使用端到端的配准方法
多站无源定位技术因其隐蔽性好、作用距离远和成本低等优点在军事领域和民用领域都具有十分广泛的应用。特别是在电子对抗领域,无源定位不主动对外发射电磁波,而是利用目标发射或反射的电磁波,实现对敌方无人机(UAV)、雷达等设施的静默定位,在现代化战争中发挥着愈发重要的作用。目前,无源定位中常用的定位参数有:到达角(AOA)、到达时间差(TDOA)、到达频率差(FDOA)和接收信号强度(RSS)等。本文从几
技术总是在变革中发展,移动通信系统在过去的几十年里迅速地由第一代移动通信技术(1G)发展到已经展开大规模商业部署的第五代移动通信技术(5G),再到目前许多国家都在启动的第六代移动通信技术(6G)研究,移动通信技术已成为世界各国开展科技竞争的制高点。技术发展规律决定了每一代通信技术的标准都需要较长的时间才能够走向成熟,5G虽然已经开始商用,但从非独立组网到全面独立组网的持续演进仍需要时间,针对高带宽
学位
医学图像配准作为医学图像分析的重要工具,其广泛地应用于疾病辅助诊断、人脑图谱以及图像引导放疗等领域。相对于传统3DCT(3-Dimension Computed Tomography,3D CT),肺部4DCT加入了时间轴,其可以为个体提供整个呼吸过程中的全部信息。通过对肺部4DCT图像进行配准,能够有效地刻画肺部组织结构的相对运动,有助于解决在精准放疗、病灶肿瘤跟踪以及肺功能评估等一系列临床应用
百年来,车辆带来诸多便利的同时,因为疲劳驾驶或人工操作失误人工操作失误而造成的交通事故不计其数,产生了巨大社会伤痛和巨额经济损失,人们憧憬着无人自主驾驶车辆带来社会生活进步。同时,作为汽车产业和人工智能发展必然趋势,无人自主驾驶不仅能为汽车产业带来巨大市场利益,而且是人工智能一定要征服的高峰。近年来,越来越多无人驾驶出租车、摆渡车、移动零售车出现在城市道路,公园广场等常见生活场景。  车道线作为道
学位
基于图像的人体行为识别是将计算机视觉和人工智能相结合实现人体行为识别的一种智能化技术,其已广泛应用于特殊人群监护、人机交互等领域,并已成为人工智能的研究热点之一。  目前,基于图像的人体行为识别技术的研究主要基于单分类器,通过优化特征信息、改进识别算法来实现。其虽然取得了很多研究进展,但在模型的通用性和准确率的提升方面仍存在研究瓶颈。单个分类器通常只针对训练好的几种行为的识别效果好,行为种类变化后
学位
近年来,随着可穿戴设备的增多以及互联网技术的发展,人与人之间的信息交互方式发生了巨大改变,由于图像、视频等多媒体数据具有更加形象生动的特征,所以可以更好地满足广大智能媒体用户的需求。然而,随着多媒体数据的爆发式增长,导致了一系列信息检索与空间存储问题。  视频摘要技术利用计算机自动地从原始长视频中提取关键的图像帧或视频片段作为重点摘要内容,使得摘要后的视频总时长缩短,同时还能够将用户认为的重要内容
学位
工业技术在国家综合生产能力体系中占有举足轻重的地位,工业和制造业的发展是一个国家经济实力的重要体现。近年来,随着我国工业化进程的加快和中国“智能制造2025”的推进,工业互联网成为重要的网络基础设施,众多新型工业计算密集型应用也开始涌现,如工业目标检测(Object Detection),人脸识别(Face Recognition),多媒体(Multimedia)传输等等。同时,伴随移动互联网和无
学位
双目视觉技术在计算机视觉领域中仍然属于较火热的研究课题,其在三维重建、机器人实时导航以及自动驾驶中有着广泛的应用。立体匹配在双目视觉中具有举足轻重的地位,其匹配结果的精度将直接影响最终视差图的精度,因此提高双目视觉中立体匹配的精度对促进双目视觉技术的发展有着重要意义。本文主要研究了如何将卷积网络应用在立体匹配中,并改进了网络结构和后处理方法,提高了算法性能,本文主要工作分为以下方面:  (1)对双