非控制条件下的头部姿态估计

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:yw1234c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术及人工智能的迅猛发展,头部姿态估计在智能驾驶、人机交互等领域的潜在应用价值受到广泛关注。同时,头部姿态估计在人脸识别、活体检测以及表情识别等视觉属性分析任务中起着至关重要的作用。近年来,基于深度学习的头部姿态估计方法在受约束的条件下表现出色,但由于成像条件,如光照和场景变化、部分遮挡以及极端表情等因素的影响,现有方法难以从众多复杂因素的影响中捕捉到对头部姿态估计最为有效的信息,并且在新的自然应用场景中缺乏良好的泛化能力。针对上述难题,本文的主要创新点和贡献如下:1、针对于传统方法难以从众多复杂影响因素中捕捉与头部姿态最相关的信息,提出了一种以组监督方式进行解耦的头部姿态估计方法。具体而言,首先将一组在某一方向上姿态相同的图像对编码到潜在的特征空间内,在此空间对共享姿态的部分特征进行交换重组。接下来,将重组后的特征输入解码器以合成原始图像。基于此,明确地通过编码解码的方式找到了一组面部图像对所共享的姿势相关特征。实验结果表明该方法能够有效解耦出与头部姿态最相关的特征,在主流头部姿态估计数据集BIWI上的平均绝对误差降低了约 9.4%。2、针对无约束条件下跨数据集的头部姿态估计任务,提出了一种域自适应的估计方法。具体而言.该方法设计了一个域判别器用于区分来自合成图像域和真实图像域的特征,同时对特征提取网络进行训练,达到其提取到的特征能够混淆域判别器使其无法鉴别来自不同领域图像特征的目的。最终该模型通过对抗的方式学习到了一个不同数据域之间共享的与头部姿态相关的特征空间。在跨数据集设置下的实验结果表明,该方法有效地减轻了数据集分布差异带来的影响,可有效提升非控制条件下头部姿态估计的性能,在主流评估数据集AFLW2000上的平均绝对误差降低了约3%。3、以所提出的头部姿态估计方法为依托,以易用性为主要原则,设计并实现了一个头部姿态估计原型系统用以进行模型训练、模型测试以及姿态估计。姿态估计模块以二维人脸图像为输入,利用本文所提出的网络模型进行头部姿态估计,以头部的三维空间姿态为输出。本系统可以充分验证本文模型得有效性和实用性,也能够进行简单移植,对其他头部姿态估计模型进行性能评估。
其他文献
全球气候变暖已成事实,这对人类社会、经济及生态环境产生重要影响。作为陆地生态系统中最重要的组成部分,植被在改善生态环境、减少水土流失等方面发挥巨大作用,但随着我国人口和经济的快速增长,人类活动可以直接或间接影响植被覆盖,加之气候变化的区域差异性,使植被覆盖变化十分复杂。深入研究植被覆盖的时空变化特征并探究其驱动因素对于制定生态文明建设的政策具有重要意义。黄河流域大部分位于干旱半干旱区,对气候变化十
学位
宁夏沿黄城市带生态环境脆弱,水资源时空分布不均。分析宁夏沿黄城市带干旱与径流响应机制,对了解地区的干旱驱动机制,进一步研究黄河流域高质量发展,优化区域农业水资源管理具有重要意义。本文以宁夏沿黄城市带为研究区域,以1995-2015年为研究时段,选取土地利用、DEM、土壤、气象等数据为基础数据,在ArcGIS10.8、ENVI5.5、MATLAB2021a等平台的支持下,采用3S技术、Budyko水
学位
20世纪30年代左右,随着城市近代化的发展、地区经济水平的提高,兰州出现多种不同类型的报纸,民众得以通过新型报纸接收到更多的外界信息,一改闭塞视听的局面。其中具有代表性的《甘肃民国日报》也在此时应运而生。作为民国时期甘肃省出版时间最长、影响力最大的地方报纸,该报在注重日常“新闻纸”的宣传外,也注重广告的刊载,在1943年的《甘肃民国日报》中广告版面就曾与新闻版面“平分天下”,数量众多的报纸广告不仅
学位
基于对《人民日报》乡村医生报道的内容分析和框架分析,本文试图回答:《人民日报》是怎样建构乡村医生媒介形象的?建构出乡村医生何种媒介形象?乡村医生媒介形象建构演变逻辑?乡村医生媒介形象建构特点?本文提出,《人民日报》运用不同的新闻生产框架,建构出奉献者、学习者、改革者以及服务者四种正向积极的乡村医生媒介形象。乡村医生形象塑造从“单薄化”走向“立体化”,人物塑造从“圣神化”走向“职业化”,媒介形象从“
学位
六盘山片区作为我国脱贫攻坚的主战场之一,是主要的欠发达地区。在后2020相对贫困治理时期,如何缓解六盘山片区相对贫困问题,进而助推乡村振兴,实现区域高质量发展等国家战略,具有十分重要的意义。然而,只有在把握六盘山片区相对贫困状况的基础上才能更好地实现乡村振兴。基于此,本文对六盘山片区相对贫困测度与时空分异机制及关系机制展开研究。基于现有研究,本文通过整理贫困地理的研究进展,对贫困地理学的理论基础,
学位
自新中国成立至上世纪七十年代,近三十年的时间里来自全国各地的青年男女参与到支援宁夏建设的行列中,形成了“支宁人”这一特殊的社会群体,支宁工人则是该群体中的典型代表,正是他们一手搭建起宁夏的工业系统。虽然如今这些支宁工人已经成为耄耋老人,但关于他们过去工作和生活的记忆并没有因时间而消逝,他们的集体记忆依靠不同的媒介得以保存与延续。本研究以集体记忆理论为框架,通过文本分析和深度访谈的方法,探讨支宁工人
学位
城市形象是指公众对一个城市内在综合实力、外显表象活力和未来发展前景的具体感知、总体看法和综合评价,反映着城市总体的特征和风格。随着现代城市发展进程越来越快,人们已经不能完全依靠自己的社会实践活动去了解一座城市,媒体上传播的内容成为人们掌握城市形象的重要渠道。自2009年召开第五届中国传媒经济年会以来,“中国传媒与城市发展”成为社会各界讨论城市形象的主题,此后几年,我国多次召开“媒体与城市发展”相关
学位
多任务学习作为深度学习的一个分支,得到了广泛关注与深入研究,但由于目前对任务的相似性、关系、层次性等的理解非常有限,使得深度多任务学习神经网络区分任务困难;其次,深度多任务学习神经网络的结构由一般的层参数共享逐渐演变到具体层之间的连接和切换,愈加复杂。因此,针对上述问题,提出基于混合共享与网络优化的多任务学习方法。主要工作如下:(1)针对网络区分任务困难的问题,提出多任务混合学习方法。首先,无需区
学位
随着物联网等新兴业务的快速发展,对终端设备的计算能力要求越来越高,但其计算能力有限,难以满足业务实时处理的需求。移动边缘计算通过将部分终端任务卸载至计算能力更强的边缘服务器,有效解决终端设备计算能力不足的问题。然而,对于静止状态下的终端设备,使用有限移动边缘服务器不能完全满足计算力的需求。特别在人员密集的公共场合,如火车站、商场等,大量静止终端设备集中部署,只依赖部分边缘服务器难以满足大量实时密集
学位
近些年制造系统的要求不断变化,面向客户需求、多样化产品、批量生产逐渐变成主要的生产模式,在企业实际生产过程中,调度安排是效率的关键所在,柔性车间作业调度从传统车间作业调度问题扩展而来,加入了约束条件和多目标优化等,完成不同的企业需求,在选择问题的研究方法时,需要结合不同目标确定合适的算法并建立调度模型,解决实际生产的需求具有重要的理论和实际意义。在此背景下,本文围绕多目标柔性车间作业调度展开研究,
学位