论文部分内容阅读
手语是聋哑人进行信息交流的最自然的方式。过去,聋哑人主要依靠文字短信方式进行移动通信,但文字交流的速度受限于打字能力,并且聋哑人理解文字信息的速度比理解手语信息的速度慢7到10倍。随着移动通信技术的发展、具备视频摄取和播放功能移动设备的日益普及,以及新一代视频编码标准H.264的广泛应用,研究人员提出了移动手语视频通信技术。该技术在不增加硬件模块的基础上用移动设备实时采集、编码和传输手语视频信息,极大地方便了聋哑人之间的交流。实时的手语视频通话受两个关键因素影响:一是有限的无线网络带宽;二是有限的移动设备电池能量。用于手语视频编码的H.264标准具有很高的视频压缩效率,非常适合于带宽受限的移动应用,但其编码的高计算复杂度带来视频通话的高功耗,使得原始H.264编码器很难长时间在能量受限的移动设备上运行。面对无线视频通信的高功耗与移动设备有限电池能量之间的矛盾,本文从手语视频编码标准H.264本身入手,研究相应的低功耗视频编码算法,通过计算资源和比特资源的优化分配,在尽可能保证视频编码性能的同时,延长无线移动终端的电池工作时长。本文主要做了如下工作:(1)提出了基于灵活宏块排序(Flexible Macroblock Ordering, FMO)的感兴趣区域比特资源分配算法。该算法根据聋哑人对手语视频中不同区域的视觉选择特性,将手语视频划分为三个不同的区域,通过FMO技术为不同区域分配不同的量化参数,从而进行比特资源的优化分配;(2)提出了一种H.264编码复杂度可分级算法。该算法根据无线移动终端电池能量随系统工作时长的变化而呈现不同的能量状况,将H.264手语视频编码的复杂度分为三个不同的级别,编码器根据设备电池能量状况自适应选择编码复杂度级别进行视频编码,从而实现计算资源的优化分配。为了验证算法的有效性,本文对标准的手语视频序列进行实验测试,从主观和客观两方面对实验结果进行了分析和评价。研究结果表明,本文算法在保证手语视频感兴趣区编码质量的同时,可以有效地降低编码器的计算复杂度,特别是在低能量状况下也能最大限度地延长视频通话时长。