论文部分内容阅读
全景视频作为一种新的多媒体技术,给人们带来了全新的沉浸式体验。全景视频本质上是一种球面视频,但现有的主流编码标准还无法直接对球面视频进行编码。为了适应现有的编码器标准,一般会将视频场景从球面格式投影成平面格式。但在投影的过程中,图像往往发生形变或失真并导致编码性能的降低。因此,选择合适的投影格式和编码优化方案对于改善全景视频的编码性能有着重要意义。克拉斯特抛物线投影格式(CPP,Craster’s Parabolic Projection)作为一种等面积投影,其投影平面上的像素点和球面上的像素点一一对应,近似球面均匀采样,无冗余像素。但CPP格式的投影图像并不是矩形,无法利用传统编码器进行编码。针对该情况,本文给出了CPP格式的编码优化方案。为了实现CPP格式的矩形化,本文提出了基于扩边和拉伸两种矩形化方案。首先,本文将CPP图像沿纬度划分成等间隔的条带,然后分别使用球面上相邻的像素和CPP投影图像上相邻的像素对每一个条带进行左右扩边,使条带变为矩形。实验结果表明,基于球面相邻关系和基于平面相邻关系的两种扩边方案都能很好地避免由于CPP边缘造成编码性能不高的问题,并且相比较于同纬度的ERP条带,两种扩边方案下CPP条带的编码性能BD-rate对Y分量平均减少2.01%和3.51%、U分量平均减少了5.00%和6.10%、V分量平均减少了5.21%和6.09%。基于拉伸的矩形化过程中,不同的插值算法对拉伸图像的质量影响不同。为此本文分别研究了基于一维最近邻插值和基于Lanczos插值拉伸的矩形化编码方案。实验结果表明,相比较于原始的CPP条带,两种插值拉伸下矩形化方案的编码性能BD-rate对Y分量平均减少了6.61%和29.7%。相比较于同纬度的ERP条带,基于Lanczos插值拉伸的矩形化方案的编码性能BD-rate在Y分量上平均减少了8.94%、在U分量和V分量上分别减少了9.52%和11.06%。为了进一步提高CPP格式的编码性能,本文在条带矩形化编码技术上,分析了不同的条带划分方式对CPP编码性能的影响,并给出基于单次划分下和基于固定划分间隔下的最优编码方案。实验表明,相比较于整幅未划分的CPP图像,本文得到的两种最优编码方案性能BD-rate对Y分量平均减少了7.63%和7.88%;相比较于ERP图像,两种最优编码方案的编码性能BD-rate对Y分量平均减少了3.59%和3.74%,U分量平均减少了3.90%和4.53%,V分量平均减少了3.46%和2.25%。