自然环境下的人脸器官牲点定位算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:eusnkk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸器官特征点定位,即在人脸上确定某些器官的位置并进行标注。随着人工智能、生物识别技术的发展,作为人脸对齐、人脸识别、姿态判定、表情分析等的基础,人脸器官特征点定位成为视觉领域研究最为广泛的问题之一。以此同时,由于自然环境下的特征点定位受姿态、光照、表情、遮挡等因素的影响较大,该问题也成为了极具挑战性的问题之一。近年来,中外学者提出了多种定位方法,在定位的速度、精确率、鲁棒性等方面均获得了一定的提升。  基于形状回归方法的主要思想是通过多次的迭代更新来提高定位的精确度,具有较快的定位速度。这类方法中,通常使用平均脸或从训练集中抽取的人脸作为迭代的初始形状,当初始形状与目标点的真实位置差距较大时,有可能在更新过程中陷入局部最小,影响定位结果。基于卷积神经网络的方法通常具有较高的定位准确率,但由于其模型复杂、数据量大,所需的定位时间也更多。  针对上述方法各自的优劣,本文提出了新的人脸特征点定位算法。主要工作包括以下几点:(1)在形状回归中引入卷积神经网络做初定位。使用卷积神经网络的定位结果取代平均脸作为初始形状,再进行后续迭代更新,从而得到精确的特征点位置。与传统的基于多个卷积神经网络级联或并联的算法相比,改进的算法简化了模型结构,提高了运算速度;同时具有比传统基于形状回归的方法更好的定位准确率;(2)引入精确人脸框定位模块。考虑到人脸框大小对后续定位结果的影响,在用于初定位的卷积神经网络前面加入一层额外的卷积神经网络用于精确人脸框定位,对一般人脸检测器的检测结果进行修正,从而减少背景信息的干扰,进一步提高定位精度;(3)引入迭代次数自适应机制与最优化选择机制。对有不同定位难度的图片使用不同的迭代次数,从而提高资源的利用效率;在每次迭代结果中选择误差率最小的结果作为输出,减小了偶然误差的影响;(4)采用L1范数作为正则化函数。将形状回归中全局线性回归的目标函数变为基于L1范数正则子的Lasso回归,进一步提高了算法的准确率。
其他文献
在机载对地观测领域,装载于低空、小型无人机平台,飞行高度低、观测距离近的合成孔径雷达(Synthetic Aperture Radar,SAR)受到广泛关注。它要求雷达体积小、重量轻、成本低、功耗
地震勘探的最终目的是得到地下介质分布情况,全波形反演(FullWaveformInversion,FWI)可以更精准的获得地下介质的参数如速度、密度等,但是实际资料处理中存在大量干扰,这会影响全
超宽带技术(Ultra-wideband,UWB)由于传输速率高、功耗低、成本低、抗多径能力强等优点,近年来受到业界广泛的关注。IEEE标准化组织已经将超宽带无线通信技术作为高速无线个域网
随着互联网技术的高速发展和移动通信技术应用的空前繁荣,社交媒体成为社会生活中人们获取和分享信息的重要工具,用户越来越喜欢在社交网络上发表言论和观点。社交媒体也得益于
由于卫星通信有着覆盖范围广、通信距离远、不受地理条件限制、组网机动灵活等优点,在未来的无线网络中将会得到越来越广泛的应用。同时由于卫星网络具有传播时延大、网络拓扑
近年来随着无线通信技术的快速发展,分布式天线系统(Distributed Antenna System,DAS)由于其在覆盖范围、信道容量、和传输功率等方面的优势,在室内应用的越来越广泛。然而,
随着信息化技术的深入,越来越多的企业建立了自己的ERP、CMR、MES系统。但随着时间的推移,各个系统运行数据库中的数据激增,如果想在原有数据库的基础上添加支持决策分析的分析
随着人类对视觉体验的要求逐渐提高,以及具有高分辨率和高帧率的图像采集设备的广泛应用,图像处理系统面临的难题越来越多,包括被处理图像的采样率增加、处理算法的复杂度提
作为继互联网之后的第二大网络,无线传感器网络将在不远的未来对人们的生活产生深远的影响。无线频谱传感器网络作为它的一个子集,其主要功能是完成特定地区的频谱监测传感任务
由于大量非线性负荷相继投入到电力系统中,出现了谐波电压、谐波电流、三相不平衡、电压波动和闪变、频率偏差、电压骤降和骤升等电能质量问题。因此,供电公司和电力客户越来越