基于计算机视觉的头部姿态估计

来源 :上海海洋大学 | 被引量 : 2次 | 上传用户:shulili1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据不完全统计,中国每年因为交通事故死亡的人数超过10万人,占全球交通事故死亡人数的五分之一,居全世界之首。随着人工智能的快速发展,利用人工智能算法解决日常任务变得越来越常见。在这样的背景下,使用计算机视觉技术高效准确的判断驾驶员头部姿态,进而反映驾驶员精神状态变得可能。基于此,本文主要研究如何通过单幅图像设计出一种精度高且时效性好的大尺度头部姿态估计算法。在汽车行驶过程中,算法通过检测驾驶员的头部姿态,对驾驶人员的精神状态和神情状态进行估计,目的是能有效的降低因为疲劳驾驶、看手机而造成的车祸发生率。头部姿态估计算法是实现此检测系统的基础和重点。通过查阅大量头部姿态估计算法文献,针对头部姿态估计算法中的不足,本文设计了两种头部姿态估计算法。经过实验证明,本文头部姿态估计算法可以准确、快速的估计出被检测人员的头部姿态。本文算法亦可以用在活体检测、人机交互等相关领域。本文主要完成如下工作:(1)优化人脸检测速度。头部姿态估计算法的实时性和准确性,要求人脸检测算法具有准确、快速的特点。本文在原有人脸检测基础上改进人脸搜索策略,首先通过背景消去建模提取前景区域,在前景区域检测人脸,得到人脸坐标值,利用两帧之间的人脸位置信息,预测人脸位置,有效减少算法搜索面积,优化人脸检测时间。(2)优化人脸跟踪精度。现有的目标跟踪算法存在两个问题:跟踪失效时无法恢复跟踪;发生漂移后无法重复定位目标。针对这两个问题,本文在滤波器跟踪算法KCF和Camshift算法的基础之上,提出了一种能够在跟踪失败时重新跟踪的改进方法。在对视频目标进行跟踪时,该算法调用KCF和Camshift跟踪算法结合背景消去建模,设计“投票”模块。经过实验证明,提出的算法能够有效地抵抗遮挡干扰,尤其是在出现跟丢目标的情况下,能够重新初始化目标的准确位置,提高了跟踪的鲁棒性。(3)提出基于特征点的人脸跟踪算法。检测人脸特征点坐标位置,利用人脸坐标位置设计两帧之间描述人脸位置“关联度”的特征,并利用此特征结合支持向量机分类器,设计出一种基于支持向量机的人脸跟踪算法。此算法可以实现多目标跟踪,此跟踪算法专一性好,鲁棒性高,具有很好的实用性。(4)提出基于SVM的头部姿态估计算法。使用68个人脸特征点坐标位置,设计一种描述头部姿态的人工特征,并对提取的特征进行优化,利用优化后的特征向量结合SVM分类器,训练特征向量后,得到一种头部姿态估计算法。实验结果显示,此头部姿态估计算法具有较高的准确率和实时性。(5)提出基于卷积神经网络的头部姿态估计算法。参数估计是头部姿态估计算法的核心,提出基于卷积神经网络的头部姿态估计算法。对神经网络层数,宽度,深度和全连接层做了细致的分析和调参,设计一种卷积神经网络结构用于头部姿态估计,在自建训练集过程中添加抚摸眼镜,头发等动作,测试时表现出很强的鲁棒性。由实验结果可知,该头部姿态估计算法抗干扰能力强,实时性高。最后,整个头部姿态估计算法经过大量测试,算法准确性、健壮性和实时性均满足要求,可以用在活体检测、汽车辅助驾驶和人机交互等方面。
其他文献
随着移动互联网的高速发展和快速普及,人们逐步进入万物互联的时代,每天都会产生海量的移动数据信息。特别是近些年不断兴起的短视频社交APP和电商APP,这类APP每天都会产生大量的短视频和图片,它们的数据存储空间相对较小,大都在10M左右。然而当前业界的HDFS、GFS等分布式文件存储系统都是针对大文件设计的,在处理海量小文件的时候其性能会急剧下降,甚至无法正常对外提供服务。设计一个海量小文件的存储访
目的:回顾性分析全疆地区7年脑瘫患儿的数据信息,分析其流行学特征及分布规律,为脑瘫的预防控制提供信息参考;采用数据挖掘方法,筛选、提取、简化脑瘫患儿临床诊断分型以及手术方式选择的相关临床表征指标,为疾病的临床决策提供方法学参考。方法:收集20112017年于新疆脑瘫康复中心治疗的脑瘫患儿数据以及20172018年住院患儿的病案信息。采用描述性流行病学方法分析2011-2017年1926例脑瘫患儿的
委婉语是英语里常见的一种修辞手段 ,一方面 ,就其交际目的而言 ,它可以分为肯定和否定两类 ;另一方面 ,从讲话者的意图来考虑 ,包括肯定和否定在内的委婉语又可以分为有意、
近二三十年间,随着经济水平的发展,我国城镇化进入加速发展通道,与此同时也产生了所谓“(大)城市病”。因此,针对新型的、可持续的城镇化发展模式的探索迫在眉睫。在各大城市
在2011年北师大出版的《中小学音乐课程标准》中明确提出:“要充分利用音乐艺术的集体表演形式和实践过程,培养学生良好的合作意识和群体意识。”在音乐教学实践中,合唱作为
针对某光伏企业废水处理站工艺路线不合理、处理能力不足、出水不达标等问题,采用物化沉淀—水解酸化—MBR工艺进行改造,在基本不增加构筑物的前提下,将处理能力由不足1 000
《品德与社会课程标准》指出:“在教学时要善于调动和利用学生已有的经验,结合学生现实生活中实际存在的问题,共同探究学习主题,不断丰富和发展学生的生活经验,使学生在获得
《塔里木河》是一部"以人为本,以河为线"的纪录片,该纪录片将地域性的民族文化呈现为普罗大众所能理解、接受和喜爱的影像,通过叙事技巧和视听语言来呈现一方文明的发展进程
本文主要研究了水体泄漏柴油、原油、苯乙烯的反射率光谱与其污染物厚度间的关系,对水上污染物厚度预测实验的可行性进行了分析研究,在此基础上主要是针对低空无人机(多光谱)和地物(高光谱)不同观测平台下获得的两种光谱数据,分别提取了不同污染物的厚度预测变量。然后,通过多元线性回归、偏最小二乘、支持向量机和随机森林四种预测模型分别建立了水上柴油、原油、苯乙烯泄漏的厚度估算研究,主要的实验结果如下:(1)利用
本文选题基于研究生阶段实习过程中参与开发的用于互联网产品大数据处理的系统项目。该互联网产品有着千万级别的用户基数和稳步增长的用户数量,为了区分出不同用户,与目标用户产生互动从而保持用户忠诚度以及激发新用户的兴趣,因此需要对现有的全量用户的相关数据进行处理,筛选出目标用户以及相关信息。因为该互联网产品的全部用户相关数据都存储在关系型数据库中,传统处理数据的方法是采用多线程编程单机部署程序的方式,但是