基于深度学习的轻量化人脸检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:shmilyfanwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年深度卷积神经网络的快速发展促使图像识别、目标检测、图像分割等领域准确率大幅提升,基于深度学习的图像技术被广泛应用于生活生产中。人脸检测作为目标检测领域重要的子分支成为研究热点,当前在多种数据集上已有准确率非常高的算法提出,诸多前沿算法模型基于庞大参数量的网络结构,尽管拥有较高的准确率,但实际运行速度很低,难以满足实际生活生产的需求。本文从模型设计与模型压缩两方面入手,设计了一个轻量化的人脸检测算法并运用多种模型压缩进一步优化模型。本文不使用分类预训练模型,而是根据感受野设计了轻量化的骨干网络;针对特征融合时缺乏适当监督信息引导和不同层梯度不一致的问题,本文提出语义引导损失和双分支结构优化特征融合;针对分类得分与目标框回归质量缺乏关联性问题,本文添加了Io U评价分支来回归目标框质量得分;在推理阶段使用Io U评价得分与语义掩码共同优化推理结果。最终在不使用预训练模型从头训练网络且不使用额外关键点标注数据的情况下,在WIDER FACE数据集的Val/Test子集SIO测试精度为Easy:0.932/0.927,Medium:0.922/0.919,Hard:0.782/0.794,多尺度测试精度为Easy:0.937/0.929,Medium:0.928/0.920,Hard:0.864/0.860。模型参数量为16.4M,480*640输入尺寸下,在1080Ti显卡上前向运行时间为13.4ms,取得了精度与速度的良好均衡,具有良好的应用价值。针对中间层特征的蒸馏时受大量背景噪声影响的问题,提出了结合前景感知的人脸检测模型知识蒸馏方法,将模型参数量减少66.5%,耗时减少20.1%,WIDER FACE数据集Val子集上SIO测试结果为Easy:0.912,Medium:0.905,Hard:0.788;因骨干网络耗时占比最大,本文基于BN层系数对骨干网络通道进行剪枝,在精度几乎无损失的情况下,将蒸馏后的模型的骨干网络通道删减41.75%,参数量减少49.1%,耗时减少8.4%;为了提高模型在GPU设备上的运行效率,本文使用TensorRT工具对蒸馏前的模型、蒸馏后的模型、蒸馏后又剪枝的模型分别进行加速和INT8量化,使模型运行速度进一步提升。最终得到一系列可在GPU上高帧率运行的、实用的轻量化人脸检测模型,大部分模型都可以100fps以上运行。
其他文献
聚合物发光二极管(Polymer Light-Emitting Diode,PLED)具有可溶液加工、成本低且能大面积制备等优点,能很好地应用在大面积柔性显示设备和固态照明设备中,因此PLED具有很大的商用潜力。目前PLED所采用的红、绿、蓝三基色发光聚合物中的蓝光发光聚合物常见为聚芴衍生物,但是大多数蓝光聚芴材料的电致发光效率均小于3cd A-1,且电致发光光谱也不是很稳定,使用寿命短,故PLE
目的:心室压力增高是心肌纤维化的重要致病因素。压力感受器Piezo1能将机械应力转变成细胞内的Ca2+信号,且Ca2+调控异常与心肌纤维化密切相关,但Piezo1是否介导了高静水压诱导心肌纤维化还有待进一步探究。此外,DNA去甲基化也在心肌纤维化的发病中扮演重要角色,其中DNA去甲基化酶(TET)是调控DNA去甲基化的重要因子,但TET与心肌纤维化的关系还有待进一步阐明。因此本研究拟探讨:Piez
智慧城市的概念自2008年被IBM提出,近二十年以来一直备受各界关注。智慧社区是智慧城市最重要的组成部分,也是与民生最息息相关的技术应用。截至2018年我国已经陆续开展约500个智慧城市试点项目,智慧社区将是一个研究热点。本文紧密结合当前智慧社区的发展形势及应用现状,针对当前智慧社区存在的忽视居民需求、缺乏效益量化评价的现状开展相关研究。本文首先在对智慧城市及智慧社区等相关理论学习和国内外大量文献
随着社会不断发展,不可再生能源紧缺、环境污染等问题日益严重,移动电子设备、新能源汽车的蓬勃兴起,发展绿色环保、可持续的锂离子电池是未来的必然趋势。而当前商业市场上使用液态电解液的锂离子电池能量密度有限和存在安全隐患等问题限制了其进一步发展,为了解决能量密度和安全性问题,发展使用固态电解质的全固态锂金属电池是未来的必经之路。固态聚合物电解质是目前研究最成熟的一类固态电解质,具有易成型、与电极相容性好
Ⅲ族氮化物紫外发光二极管(Ultraviolet Light-Emitting Diode,UV LED)在杀菌消毒、医疗、气体传感和聚合物固化等领域具有广阔的应用前景。目前,相比于In Ga N基可见光LED,Al Ga N基UV LED的外量子效率(External Quantum Efficiency,EQE)很低,阻碍了其商业化应用的进程。高Al组分的Al Ga N基UV LED,面临着强
动力电池作为电动汽车的核心部件,其性能直接影响着电动汽车的可靠性和安全性。温度对电池性能及寿命有着较大影响,过高或过低温度都会导致电池性能衰减甚至破坏失效,因此有必要设计开发安全高效的动力电池热管理系统。针对小型与大型动力电池模组存在的热管理问题,本文分别提出了基于超薄均热板和基于三维热管阵列的动力电池集成式热管理技术,并研究分析其与不同散热方式结合的热管理效果。本文首先设计并制造了厚度为0.8
随着大众的信息安全意识不断增强,人们对身份识别方法的便捷、准确和安全性要求越来越高。掌纹和掌静脉相比指纹、指静脉等生物特征,具有特征区域大、纹理信息丰富等特点,在身份识别任务中有着优秀的性能,因此,近年来掌纹掌静脉识别技术引发了学术界和工业界的广泛关注和研究。目前掌纹掌静脉识别在实际应用中仍然存在用户体验差、训练数据缺乏、静脉成像受手掌温度影响较大等问题。由于现有的系统要求用户手掌在特定区域停留一
癌症是威胁人类健康的一个重要因素,具有生理复杂性和异质性。随着高通量测序技术发展,利用多组学数据进行癌症分型研究是一个重要的研究方向。尽管有了一些利用统计学和深度学习来整合多组学数据的研究,但是受限于多组学数据之间高度不平衡的维度和尺度差异,以及生物数据的高噪声,目前仍缺乏更有效率的整合方法。针对上述问题,本文提出了三种多组学整合分型方法,渐进式地开展多组学整合分型研究。首先提出了深度网络多组学整
语音增强是从带噪语音中恢复出干净语音分量,以提高语音的听感质量和可懂度。传统的语音增强算法假设噪声是平稳的,但是生活中的实际噪声是随机且非平稳的。而现代的神经网络语音增强算法无需假设噪声性质,可以直接学习带噪语音到干净语音的映射关系。但是不同的训练目标会有不同的语音增强效果,而且单个神经网络的学习能力也是有限的,因此多目标学习和集成学习算法开始应用在语音增强领域。多目标学习语音增强算法可以同时优化
基于分类模型的ECoG术中脑功能定位有望实现准确、快速、无创的神经外科脑功能区定位,但由于个体之间的功能区ECoG特异性差异,存在功能区定位算法泛化性能差的问题。本文设想采用聚类和分类结合的定位方法来提高算法的泛化性能,开展基于静息态ECoG聚类和二分类的术中脑功能区定位算法研究。首先,优化静息态ECoG的采集方法和预处理算法。设计智能电极接触状态检测器的上位机软件,分析和指示皮质电极与大脑皮层接