基于三维模型的图像集压缩编码

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zhengjjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今互联网时代下云计算和云存储的飞速发展,网络云端存在的大量图像数据给业界带来了巨大的存储压力。与此同时,这些数据中包含大量的相似图像。它们通常在云端以图像集的形式组织和存储,集合内的图像包含同一个场景对象,具有较强的相关性和一定的差异性。现有的图像集压缩方法普遍采用的二维几何变换模型不够准确,难以有效压缩差异性较大的网络图像集;类比成视频序列进行预测编码,复杂度较高。因此,为了更加有效的去除相似图像间的冗余,本文提出了一种全新的基于三维模型的图像集压缩编码方案。根据Wyner提出的共性信息理论,该方案首先采用三维点云来表示图像集内所有图像的共性信息,随后参考共性信息来编码每张图像。更具体的,该方案首先采用Photo Tourism系统重建出图像集的三维点云,即场景对象的几何信息,同时估计出图像的摄像机参数。随后,采用基于上下文学习的方法,从图像集中选择一定数量的代表性图像,使用HEVC intra独立编码。最后,本文设计了一种基于三维模型的图像间预测方法,编码非代表性图像:从代表性图像中选择-张最为相似的图像;通过三维模型将其依次进行匹配像素点对、二维-三维-二维图像映射、光照补偿的过程,生成当前图像的预测;采用HEVC inter模式,参考生成的预测图像,对当前图像再进行一次局部运动补偿下的预测编码。该系统在三个公开数据集RockBoa、Herzjesu、Notre Dame上进行实验,并与JPEG、HEVC intra以及最新的图像集压缩编码方法进行对比,展现出了较为明显的性能提升。个人照片集RockBoat和Herzjesu比HEVC intra提高约10%,编码效率是JPEG的3倍;数据集Herzjesu在考虑三维模型存储开销的情况下,本文的方法比当前最优的方法提升了0.3%;对于差异性较大的网络图像数据集Notre Dame,现有方法受限于分辨率无法直接编码,而本文的方法与HEVC intra相比码率减少了1.8%。与此同时,分别针对代表性图像选择、基于三维模型的预测方法等模块的实验充分验证了各个模块的重要作用。实验结果表明,代表性图像选择模块具有显著的作用:当小数据集选择3到5张代表性图像、大数据集选择图像集图像总数量的5%-10%时,图像集总体编码效率接近最优。此外Notre Dame数据集上的实验表明,当云端存在高质量参考时,基于三维模型的预测方法性能优异,单张图像相比HEVC intra的码率减少最高可达到75.1%,图像中场景对象(建筑物)区域的主观质量也得到明显提升。综上所述,我们提出的基于三维模型的图像集压缩编码方案能够显著提高预测准确性,提高图像集压缩效率;而且该方案只选择代表性图像中最相似的一张作为参考,能够实现接近于随机存取的效果,编解码的复杂度大大降低。因此,这一方案具有较强的实际应用价值,能够广泛应用在图片社交、博物馆虚拟游览等图像集应用场景。
其他文献
随着通信技术的飞速发展,不断增长的业务需求与有限资源之间的矛盾日益突出,如何匹配资源需求与资源分配成为研究的热点。未来的无线通信网络将会变成密集的、不规则的、自组
基于图像的信息隐藏技术是将秘密信息嵌入到普通的数字图像之中,实现隐蔽通信的目的。它在提供一种安全隐蔽通信方式的同时,也可能被不法分子所利用,影响到国家安全和社会稳
随着无线网络技术的迅速发展,基于无线网络的各种应用也层出不穷。利用IP网络传输话音信息的实时语音业务,由于其相对于传统电话业务强大的优势,得到了长足的发展。在无线网
伴随着网络和多媒体技术的发展,视频信息急剧膨胀。如何对海量的视频信息进行有效地检索和查询,已经成为目前迫切需要解决的问题。因此,基于内容的视频检索(Content-Based Vi
WZF-650H(K)复合铝箔机组,用于生产包装卷烟用的复合铝纸,其复合供胶系统系用手工借助简单工具向胶盘加注胶液.
非合作单站无源定位跟踪技术以非合作的外辐射源作为照射源,具有高度的隐蔽性;其单站定位避免了多站定位复杂的信号处理过程和时间同步,具有更好的简便性和灵活性,因此成为现代电
本钢石灰石矿系为本钢提供溶剂石灰石和冶金生石灰的矿山,年产石灰石140万t,冶金生石灰40万t.主体设备为250m3机械化竖窑,自投产后窑况一直不正常,煅烧带逐渐伸长,窑顶温度超
为了确保UMTS(Universal Mobile Telecommunication System)技术的长期竞争力,3GPP于2004年底启动了长期演进(LTE)项目。该系统的一个目标是在上行链路能够提供比R6版本中的HS
在当今信息时代,高质量数码成像设备已得到普遍使用,生活中无处不在的网络又提供了大量的图片资源和视频分享网站,使得数字图像和视频在人们的日常生活中起到日益重要的作用
近些年来,作为声音识别中的一个新兴的研究方向,“声音事件识别”因其广泛的应用前景,越来越受到研究学者们的关注。通过对声音事件,例如敲门声、掌声、脚步声,甚至鸟鸣声等,