能量受限条件下的手语视频编码方法研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:knighthaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是由手形、手臂运动并辅之以表情、唇动以及其他体势表达思想的视觉语言,是聋哑人进行交流的最自然方式。与头肩视频不同,手语视频由于增加了手形、手臂运动,并且存在手脸遮挡现象,所以更为复杂,对其进行研究难度更大。和手语视频识别与合成研究相比,目前针对手语视频的编码研究还较少,且大多数都是基于率失真(Rate-Distortion, R-D)理论,以给定编码码率为约束,研究编码码率和失真之间的关系,使重建手语视频的失真最小。但是,随着无线网络带宽的快速增加和新一代视频编码标准H.264的广泛应用,编码码率的约束性已经越来越弱,而无线视频终端在功耗上所受的制约却越来越强。因此,如何在无线视频终端能量有限的约束条件下,使手语视频经编码后的失真最小,减小能耗、延长电池的更新周期已成为一个迫切需要解决的问题。本论文对能量受限条件下的手语视频编码进行了深入的研究,目的是利用聋哑人视觉选择注意机制、功率率失真理论和感兴趣区能量分配视频编码方法实现手语视频编码功耗、编码码率和编码失真之间的动态平衡优化,在确保手语视频主客观编码质量的同时,尽可能降低无线视频终端总体功耗,延长电池更新周期,为解决能量受限条件下聋哑人手语视频编码的最优化参数配置和资源分配提供新理论和新方法。本论文的研究工作主要包括:(1)理论分析和实验统计了影响H.264手语视频编码复杂度的因素,将H.264手语视频编码器参数按照复杂度分为四种不同的级别,每种级别具有不同的编码复杂度和编码质量,然后依据无线视频终端电池能量和视频运动复杂性自适应地选择编码级别。实验结果表明该方法在保证手语视频编码质量基本不变的同时,能够减少编码器计算复杂度,节省无线视频终端系统的计算资源。(2)综合考虑无线视频终端电池能量的时变性和聋哑人视觉注意机制的不平衡性,建立了感兴趣区能量感知手语视频编码方法,该方法在帧层依据无线视频终端当前可使用电池能量和视频帧复杂度确定参考帧数和搜素范围,在宏块层依据手语视频不同宏块区域的视觉重要性确定宏块预测模式和量化系数,最后根据帧层和宏块层共同确定的参数进行编码。实验结果表明该方法在保证手语视频感兴趣区编码质量的同时,能够进一步减少编码器计算复杂度,节省无线视频终端系统的计算资源。(3)详细分析了H.264帧内、帧间和跳帧三种编码模式的功率率失真(Power-Rate-Distortion,P-R-D)特性,在此基础上,分别建立了编码一帧手语视频的能耗模型和P-R-D模型,并提出了优化一帧视频中采用帧内、帧间和跳帧编码模式宏块个数的算法,实验表明所提出的P-R-D模型和实测P-R-D性能相吻合。(4)针对手脸遮挡条件下的手语视频手势检测问题,提出一种基于力场(Force Field)转换的手势检测方法。该方法首先分别计算手脸遮挡帧和纯脸部帧的力场图像,然后将力场图像分块并统计各分块直方图特征,再将相同空间位置的分块直方图对应相减,得到各分块直方图灰度分量差,最后将各分块直方图灰度分量差与灰度阈值进行比较获得手部位置。实验证明该方法能够实时进行手脸遮挡条件下的手势检测。
其他文献
由甘肃黄土高原的榆中站,定西站和西峰站的实测(1989~1992年)农田土壤湿度的对比分析得出,黄土高原半干旱区农田土壤水分的变化规律是:在一年内有春季严重失墒期,夏秋增墒期,秋冬缓慢失墒期和
特色高中的建设必须牢牢把控“质”和“量”。特色高中的“质”是指提炼特色高中的本质、挖掘全体学生的潜质、创造特色高中的优质。特色高中的“量”是指接受特色教育的学生
目的 探讨子宫内膜异位症实施中西医联合护理的临床效果, 方法 选取我院妇科2015 年10 月至2017 年11 月收治的行腹腔镜下保留性手术治疗的子宫内膜异位症患者98 例为观察对
目的:对男性进行肝功能检测,对肝功能异常者进行病因分析。方法:采集早晨空腹静脉血,应用日立7080全自动生化分析仪。采用动力学法,进行肝功能检测。结果:被检测的1 735例男性中
随着电信运营商IT系统的转型以及IT运营模式的变革,电信运营商引入开发运营一体化思想,并结合电信实际,建立了自主研发的云道DevOps平台,首期聚焦IT应用发布,从应用的微服务
目的探究青年胃癌患者的灵性需求,为灵性照护提供依据。方法采用质性研究方法,选取13名胃癌患者进行深度访谈。结果胃癌患者灵性需求包括四方面:维护尊严、家庭和谐、实现自
兴趣是最优秀的老师,兴趣是激发学生学习的主要动力。利用各种方法激发学生学习的兴趣,学生只有对学习产生了兴趣,才能在学习的过程中获得成功的快感。学生对学习数学产生了
合成了4种四-对羧甲氧基苯基卟啉(TCMOPPH2)的金属配合物,用紫外-可见光谱和红外光谱进行了表征,并对合成的金属卟啉及配体进行了初步的光敏化实验。
盲源分离是上世纪80年代初在信号处理领域诞生的备受学术界关注的新生学科,在许多新兴领域都有着重要的应用。盲分离按照其混叠方式的不同,可分为瞬时线性混叠和非线性混叠。