基于三维模型的图像集压缩编码

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：zhengjjing

【摘要】

：

随着当今互联网时代下云计算和云存储的飞速发展,网络云端存在的大量图像数据给业界带来了巨大的存储压力。与此同时,这些数据中包含大量的相似图像。它们通常在云端以图像集

【作者】

：

邵曈

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2016年期

【关键词】

：

图像集压缩三维点云代表性图像高效视频编码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着当今互联网时代下云计算和云存储的飞速发展,网络云端存在的大量图像数据给业界带来了巨大的存储压力。与此同时,这些数据中包含大量的相似图像。它们通常在云端以图像集的形式组织和存储,集合内的图像包含同一个场景对象,具有较强的相关性和一定的差异性。现有的图像集压缩方法普遍采用的二维几何变换模型不够准确,难以有效压缩差异性较大的网络图像集；类比成视频序列进行预测编码,复杂度较高。因此,为了更加有效的去除相似图像间的冗余,本文提出了一种全新的基于三维模型的图像集压缩编码方案。根据Wyner提出的共性信息理论,该方案首先采用三维点云来表示图像集内所有图像的共性信息,随后参考共性信息来编码每张图像。更具体的,该方案首先采用Photo Tourism系统重建出图像集的三维点云,即场景对象的几何信息,同时估计出图像的摄像机参数。随后,采用基于上下文学习的方法,从图像集中选择一定数量的代表性图像,使用HEVC intra独立编码。最后,本文设计了一种基于三维模型的图像间预测方法,编码非代表性图像：从代表性图像中选择-张最为相似的图像;通过三维模型将其依次进行匹配像素点对、二维-三维-二维图像映射、光照补偿的过程,生成当前图像的预测；采用HEVC inter模式,参考生成的预测图像,对当前图像再进行一次局部运动补偿下的预测编码。该系统在三个公开数据集RockBoa、Herzjesu、Notre Dame上进行实验,并与JPEG、HEVC intra以及最新的图像集压缩编码方法进行对比,展现出了较为明显的性能提升。个人照片集RockBoat和Herzjesu比HEVC intra提高约10%,编码效率是JPEG的3倍;数据集Herzjesu在考虑三维模型存储开销的情况下,本文的方法比当前最优的方法提升了0.3%；对于差异性较大的网络图像数据集Notre Dame,现有方法受限于分辨率无法直接编码,而本文的方法与HEVC intra相比码率减少了1.8%。与此同时,分别针对代表性图像选择、基于三维模型的预测方法等模块的实验充分验证了各个模块的重要作用。实验结果表明,代表性图像选择模块具有显著的作用：当小数据集选择3到5张代表性图像、大数据集选择图像集图像总数量的5%-10%时,图像集总体编码效率接近最优。此外Notre Dame数据集上的实验表明,当云端存在高质量参考时,基于三维模型的预测方法性能优异,单张图像相比HEVC intra的码率减少最高可达到75.1%,图像中场景对象(建筑物)区域的主观质量也得到明显提升。综上所述,我们提出的基于三维模型的图像集压缩编码方案能够显著提高预测准确性,提高图像集压缩效率；而且该方案只选择代表性图像中最相似的一张作为参考,能够实现接近于随机存取的效果,编解码的复杂度大大降低。因此,这一方案具有较强的实际应用价值,能够广泛应用在图片社交、博物馆虚拟游览等图像集应用场景。

其他文献

异构网络中接入选择和资源分配研究

随着通信技术的飞速发展,不断增长的业务需求与有限资源之间的矛盾日益突出,如何匹配资源需求与资源分配成为研究的热点。未来的无线通信网络将会变成密集的、不规则的、自组

学位

异构网络接入选择资源分配用户归属

加性图像信息隐藏分析算法研究

基于图像的信息隐藏技术是将秘密信息嵌入到普通的数字图像之中,实现隐蔽通信的目的。它在提供一种安全隐蔽通信方式的同时,也可能被不法分子所利用,影响到国家安全和社会稳

学位

信息隐藏隐写分析重谱分析LSB

基于无线网络的VoIP中WSOLA算法的改进研究

随着无线网络技术的迅速发展,基于无线网络的各种应用也层出不穷。利用IP网络传输话音信息的实时语音业务,由于其相对于传统电话业务强大的优势,得到了长足的发展。在无线网

学位

波形相似叠加VoIP增益幅度丢包隐藏

视频搜索及语义提取

伴随着网络和多媒体技术的发展,视频信息急剧膨胀。如何对海量的视频信息进行有效地检索和查询,已经成为目前迫切需要解决的问题。因此,基于内容的视频检索(Content-Based Vi

学位

基于语义的视频搜索高层语义特征低层视觉特征决策级融合算法TRECVID

复合铝箔机供胶系统改进

WZF-650H(K)复合铝箔机组,用于生产包装卷烟用的复合铝纸,其复合供胶系统系用手工借助简单工具向胶盘加注胶液.

期刊

铝箔机供胶系统复合铝箔烟用手工生产铝纸胶液胶盘机组工具包装

非合作单站无源定位跟踪算法研究

非合作单站无源定位跟踪技术以非合作的外辐射源作为照射源，具有高度的隐蔽性；其单站定位避免了多站定位复杂的信号处理过程和时间同步，具有更好的简便性和灵活性，因此成为现代电

学位

电子战争非合作单站无源定位跟踪滤波算法

石灰竖窑原料筛分设备的改造

本钢石灰石矿系为本钢提供溶剂石灰石和冶金生石灰的矿山,年产石灰石140万t,冶金生石灰40万t.主体设备为250m3机械化竖窑,自投产后窑况一直不正常,煅烧带逐渐伸长,窑顶温度超

LTE系统中的同步技术研究

为了确保UMTS(Universal Mobile Telecommunication System)技术的长期竞争力，3GPP于2004年底启动了长期演进(LTE)项目。该系统的一个目标是在上行链路能够提供比R6版本中的HS

学位

LTE系统正交频分多址接入技术同步跟踪算法不连续接收

基于MPEG-2运动补偿边缘效应的视频篡改检测研究

在当今信息时代,高质量数码成像设备已得到普遍使用,生活中无处不在的网络又提供了大量的图片资源和视频分享网站,使得数字图像和视频在人们的日常生活中起到日益重要的作用

学位

数字篡改数字视频取证删帧运动补偿边缘效应

声音事件识别中的有效特征提取方法研究

近些年来,作为声音识别中的一个新兴的研究方向,“声音事件识别”因其广泛的应用前景,越来越受到研究学者们的关注。通过对声音事件,例如敲门声、掌声、脚步声,甚至鸟鸣声等,

学位

声音事件识别特征表示特征融合深层神经网络卷积神经网络频谱图特征耳蜗图特征

基于三维模型的图像集压缩编码

与本文相关的学术论文