HEVC帧内编码优化及点云序列压缩算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:toneygao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视觉传感器和激光雷达(Light Detection And Ranging,Li DAR)技术的不断发展,人们越来越容易获得高清视频、三维点云数据。高清视频、点云序列数据量庞大,现有的带宽和存储条件很难满足要求,开发高效的视频、点云数据压缩算法成了当务之急。HEVC(High Efficiency Video Coding)作为新一代视频编码标准,与上一代视频编码标准H.264/AVC相比,在相同的编码质量下,节省近一半的编码数据量。HEVC高效的编码性能是以算法复杂度的增加为代价的,这不利于视频的实时传输和硬件实现。因此,如何在不降低视频质量的前提下,降低算法复杂度,是HEVC研究的主要课题。Li DAR点云数据作为无人驾驶技术中关键的一部分变得越来越重要,已经成为自主驾驶中不可或缺的一部分。车载Li DAR点云数据视场大、激光点分布不均匀,数据庞大,存储起来非常昂贵,并且难以直接共享。车载Li DAR点云数据是有序的,可直接转换成深度图。然而传统的图像或视频编码算法,如JPEG2000和HEVC,只能对8位的整数像素值进行编码,这不适用于浮点型的Li DAR数据。同时图像的预测方法也不适用于Li DAR深度图,这给Li DAR数据的压缩带来了困难。本文研究了基于HEVC的帧内编码优化算法,并针对大视场点云数据,借鉴视频编码中帧内编码、帧间编码方法和3D-HEVC中对深度图的预测方法,提出了一种基于聚类的无损点云数据压缩算法,主要研究内容与成果如下:1)本文提出了一种基于图像纹理特征的编码单元(Coding Unit,CU)快速划分和预测单元(Predicting Unit,PU)预测模式快速选择算法。通过一种预处理算法来获得编码块的复杂度和纹理方向。一方面,根据CU的复杂度,自适应地跳过或终止部分CU的划分,减少CU深度的遍历时间。另一方面,根据PU的纹理方向,选择对应的候选模式集。通过粗模式决策算法(Rough Mode Decision,RMD)和率失真最优化算法(Rate Distortion Optimization,RDO)遍历这些候选模式选取最佳预测模式。将算法移植到标准视频解码软件HM16.7平台上,实验结果表明,与HM16.7算法相比,降低57.13%的编码时间,比特率增加0.65%,PSNR下降0.08d B。2)相邻的编码树单元(Coding Tree Unit,CTU)通常具有相似的划分结构,利用当前CTU左边、上边、左上和右上CTU的编码深度来缩小了当前CTU的深度搜索范围。我们为经典的Sobel算法在45°和135°方向上添加了两个模板。对编码块进行Sobel运算获得四个方向上的边缘。根据CU的边缘强度,判断CU是否递归划分成四个子CU。35种帧内预测模式被划成四组,分别与四组边缘方向相对应,选择边缘最强方向对应的预测模式进行RMD计算,通过减少预测模式的数量来降低算法复杂度。实验结果表明,所提算法平均节省53.66%的编码时间,比特率平均增加0.46%,PSNR损失0.05d B。3)离散Haar小波变换将图像分解成四个不重叠的子带,即LL,HL,LH和HH。子带LL包含图像的低频信息,与原图像及其相似。其它三个子带HL、LH、HH分别反应图像的水平、垂直和对角细节。我们根据HL、LH和HH子带来预测编码块的复杂度和纹理方向。根据编码块的复杂度和纹理方向来加快CU划分和PU预测模式选择的过程,降低算法复杂度。实验结果表明,算法能够节省52.73%的编码时间,比特率增加0.5%,PSNR损失为0.05 d B。4)车载Li DAR数据具有数据量大、离散分布、数据密度分布不均匀的特点。本文借鉴视频编码中帧内编码、帧间编码的方法,对点云序列进行压缩。首先将Li DAR数据转换成深度图,并基于深度图对点云进行聚类。受3D-HEVC中对深度图预测方法的启发,根据聚类结果,我们用类似的方法对深度图进行帧内预测,去除数据的空间冗余。在帧间编码过程中,通过ICP(Iterative Closest Point)算法对相邻两帧点云进行匹配,求出旋转矩阵和平移矩阵。将两帧点云数据变换到同一坐标系下,并求出它们对应深度图的残差图,去除点云序列的时间冗余。最后,使用无损数据压缩算法对帧内、帧间预测的残差数据进行压缩。实验结果显示,所提算法能够达到20倍的压缩率。
其他文献
在国家治理体系和治理能力现代化背景下,梧州城市社区治理在抓制度创新,提升社区党组织组织力;抓牢重点,强化为民服务意识;抓住关键,发挥党员作用;抓紧优势,实现资源整合等方面取得了一定成效,社区党组织核心作用进一步彰显,党员队伍活力不断激发,凝聚功能进一步增强,社会治理进一步和谐。但是,仍然存在个别社区基层党组织在社区治理中的领导核心作用发挥不理想,党建引领城市基层治理的工作机制不顺,社区工作经费保障
期刊
本文密切结合下肢康复领域中对机器人柔性驱动的需求,在国家青年基金项目的资助下,以天津大学自主研发的一种新型足底驱动柔性步态模拟机构——AirGait为研究对象,系统地研究了气动人工肌肉的非线性迟滞建模、基于气压/位移迟滞补偿的气动人工肌肉轨迹跟踪控制、AirGait的运动学建模与轨迹跟踪控制,并开展了相应的实验研究。全文取得了如下创造性成果:在系统总体方案设计方面,建立了人体下肢运动学模型,并带入
学位
虚拟货币非国家货币当局发行,不能作为货币在市场上流通使用。本文首先阐述虚拟货币相关情况,对定义,虚拟货币与相关概念的不同、分类、特征进行描述。虚拟货币犯罪表现为以虚拟货币为犯罪对象或利用虚拟货币实施的具有社会危害性的行为。犯罪行为人利用虚拟货币进行犯罪日益增多。本文在分析虚拟货币犯罪的司法现状的基础上,对常见的涉虚拟货币犯罪进行研究。为了研究的系统性,按照根据虚拟货币应用场景中可能涉及的犯罪进行分
学位
目的 探讨5种新型冠状病毒核酸检测试剂与DXcellenceTM全自动核酸检测分析系统的适配性,为临床实验室选择新型冠状病毒核酸检测方法和仪器提供参考依据。方法 参考《病原体核酸即时检测质量管理要求专家共识》对定性项目的性能验证要求,在DXcellenceTM全自动核酸检测分析系统上,搭配艾科诺公司(简称Accunome)的核酸提取纯化试剂盒,评价5种新型冠状病毒核酸检测试剂(杭州金迪安、武汉明德
期刊
空间网状天线是航天器、卫星等的重要功能组件,是移动通信、电子侦察、深空探测等任务的关键设备。反射面精度是决定天线工作频段、带宽和增益的重要因素,是天线的重要技术指标。空间网状天线是由可展桁架-柔性索网组成的超静定结构,其反射面成形机理复杂,反射面精度受控于桁架与索网之间的协调变形和索网张力,控制难度大。此外,为了保证空间网状天线进入正常工作状态,网状天线必须“展得开”且“展得稳”。目前,尚未形成空
学位
本文探讨了构建可动球面四杆机构网格的可行性,分析了折纸图案的刚性可折叠性,提出了一种构建厚板折纸的新型运动学模型。首先对单个球面四杆机构的运动学特性进行了分析。我们利用对称特性将四个相同的球面四杆机构组成了三种可动装配体,分别为旋转对称、面对称和双重对称。结合球面四杆机构运动学,归纳出这些装配体的协调条件。当机构的几何参数改变时,运动学的输入输出特性也会相应地改变。我们选择其中的16种特殊的传递关
学位
气体具有很多独特的性质,是非常重要的一类非线性光学材料。飞秒激光在气体介质中的非线性传输是超快非线性光学的重要研究内容之一。近几年备受关注的低损耗、宽带空芯微结构光纤为研究飞秒激光和气体的非线性作用提供了有力的工具。一方面空芯微结构光纤为光和气体的非线性作用提供了充足的作用距离,另一方面充气空芯微结构光纤中灵活可调的色散极大丰富了飞秒激光的非线性传输过程。本论文主要研究飞秒激光在两种新型充气空芯微
学位
人工电磁材料是指由亚波长的人工微结构所组成的新型材料,因其可以高效并自由地操控电磁波,受到人们广泛地关注。在太赫兹波,人工电磁材料为新型的太赫兹功能器件的研制提供了可行的方案。本论文基于磁场、温度和几何参数调控,系统研究了太赫兹波与人工电磁材料相互作用的新的机制和机理,具体研究内容包括:(1)基于磁场和温度调控的太赫兹人工电磁材料:利用第二类超导材料氮化铌制成可调谐的人工电磁材料结构,在实验上验证
学位
表面等离激元是沿金属-介质界面传播的电磁波,因具有高度局域化和场增强特性而在众多领域都有重要的应用前景。在太赫兹波段,由于大多数金属表现为良导体,对表面等离激元的束缚性较差。为解决束缚性差的问题,我们采用了两种金属微结构实现了束缚态的太赫兹表面波,在此基础上,开展了太赫兹表面等离激元波导、表面等离激元隐身、表面等离激元透镜等相关功能器件的研究。主要研究内容有:1.基于周期性金属圆柱的太赫兹表面等离
学位
集成光学的概念提出后,其技术得到了飞速的发展,其中光波导是集成光学中的重要光学器件之一;而钽酸锂晶体因其具有优秀的电学和光学性能,成为集成光学波导器件制作的首选材料,所以基于钽酸锂晶体光波导及其器件的制作和性能改进成为集成光学中重要的研究领域。因此,本文主要以钽酸锂晶体材料为基础,结合镀膜、光刻和热扩散技术,制作和研究钛扩散光波导和镓扩散光波导,以及进一步制作出具有抗光折变特性的铒掺杂镓扩散有源光
学位