基于FOVEA框架的视觉编码技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kueixing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与现实世界类似,在计算技术领域同样存在数据量庞大和处理能力有限之间的瓶颈。近年来,由于数字影像技术的发展,每天都有大量的数字化视觉信息(图像、视频等)产生。然而,视觉信息数量的增长远远超过了现有的硬件能力,为应用领域带来了一定的压力。例如,图像和视频信息庞大的数据量为存储系统带来沉重负担;在传输时需要耗费大量的网络流量,同时受到网络带宽的限制,用户需要等待大量的时间。为解决这一瓶颈,有效利用现有的硬件条件,方便用户访问视觉冗余信息较为庞大的视频资料,成为近年来编码领域研究的热点。如果能在压缩系统中采用某种视觉技术来达到获取较低码率和较高视觉质量的目的,是很有意义的。为此,本文对HVS特性进行了研究,提出一种基于HVS“中心-环绕”特性、人眼亮度显著性、色度显著性、运动信息显著性等特性的视频压缩方法。视频压缩中,由于人眼实际得到的是解压缩后的图像,因此对重建图像质量的评价是人们非常关心的问题。本文在总结了各种视频质量评测方法的基础上,对基于结构失真的视频质量评测方法SSIM与传统评测方法PSNR进行了实验比较,并确定采用SSIM对本文的视频压缩方法进行评测。人眼的视锥细胞和神经细胞的分配是高度不均匀的,在小凹处密度很高,而周边区域的细胞密度则下降很快。因此HVS对视频图像的分辨率也是高度不均匀的。结合人眼的这种特性,本文对基于小凹的视频编码模型进行了研究,提出综合了以背景亮度与亮度变化梯度为基础的人眼亮度显著性、以色度变化梯度与时域色度差为基础的色度显著性、与以运动强度、运动对比度与运动矢量空间相位熵为基础的运动信息显著性三种特性的基于内容自适应foveation模型的视频编码方法。在假设关注点在视频图像中心的情况下,根据视频序列的内容对该视频不同区域的分辨率进行调整。实验结果表明,该方法能够获得较好的压缩效率。
其他文献
随着Flash产业的发展与成熟,Flash存储器作为一种新的存储介质已经被广泛应用到计算机系统中,并有全面取代磁盘的趋势。由于与传统磁盘的读写特性不同,Flash存储器上的数据管理
本文在研究汉语句子相似度的过程中,针对汉语由语素构成词语,由词语构成语句的特点,分别对汉语中的义原、词语、句子三个层次的相似度计算进行了研究。并根据问句自身的特点,对问
时空数据建模技术已成为当前领域的一个重要研究方向,主要包括获取地理现象的空间、时间及属性的完整描述信息,实现时空数据的统一存储、管理,并按不同需求提取,完成时序、空间和
随着互联网的不断发展以及各种低码率视频压缩标准的提出,网络流媒体视频传输也日益普及,这给多媒体的版权问题提出了新的挑战,同时也为基于网络流媒体视频进行隐藏通信提供
无线传感器网络已经广泛应用于环境监测、目标追踪、地理路由等领域。大量低成本、多功能、微小体积的无线传感器网络节点可以布置在一定的区域形成一个大规模的、动态拓扑结
本文的研究来源于导师的课题《教育云平台的运营和管理研究》。主要研究跟教育云服务平台相关的管理和运营关键技术问题。《教育信息化十年发展规划(2011-2020年)》[1]对于国
图像和视频中的文本字符,是图像高层语义内容的一个重要来源,包含许多非常重要信息,如街道名称、商店名称、路标、交通标示等,这些信息对于图像和视频资料的自动注释、索引等方面
随着信息技术的飞速发展、市场竞争的日益加剧,越来越多的企业意识到单凭自身内部的资源整合已经难以把握快速变化的市场机遇,于是它们开始将注意力转向企业外部。这种由多个
互联网的迅猛发展和计算机水平的提高带来了信息过载问题,如何快速地从中获取用户所需要的部分,成为一个亟待解决的问题。文本过滤所研究的内容就是如何准确地表达用户需求,进而
计算机网络和多媒体技术在现代社会的各个领域中被广泛应用,带来了计算机远程教育的飞速发展。然而,随着教学内容的不断丰富和参加远程教育人数的日益增多,对远程教育系统的