基于CNN的复杂条件下人脸检测方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:bbshisegui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件性能的不断突破和计算机视觉的飞速发展,人脸识别、身份验证、表情识别等人脸应用受到广泛用户的青睐,推动了人脸检测技术的持续发展,并且成为近十年研究最多的课题之一。然而由于现实环境中存在诸多不确定因素,比如光照变化、人脸遮挡、不同姿态、多样的表情和各种不同尺度的人脸等,使得人脸检测技术很难再现实生活中广泛应用,其中人脸遮挡和多尺度人脸对人脸检测性能的影响最为严重,是目前大多数人脸检测算法存在的主要问题。本文对基于深度学习的人脸检测算法进行了分析,针对人脸遮挡和多尺度人脸等问题提出了相关改进方法,并应用于目前较为成熟的Faster R-CNN模型中,经过实验验证,本文提出的改进算法模型在这两方面的检测性能均优于大多数同类算法。本文具体工作内容如下:1、对于人脸遮挡问题。对常见的人脸遮挡情况进行了研究,首先,提出了一种改进的区域交叉熵损失函数,来对样本的局部特征进行学习,通过全局平均池化的方式将特征图直接和类别相关联,进而增加局部区域特征对分类的贡献,使检测器对局部区域特征更为敏感。其次,针对正样本遮挡人脸漏检问题,采用更加合理的软式非极大值抑制方法获得效果最好的人脸候选框,并降低重叠较大的候选框分数,提升对遮挡人脸的召回率,减少人脸漏检的情况。最后,针对现有数据库中遮挡人脸的样本数较少问题,通过数据驱动的方式,人工制作人脸遮挡的样本,使模型对遮挡样本进行充分学习,进而提升网络对遮挡人脸的检测率。2、对于多尺度人脸问题。对人脸检测算法对不同尺度人脸检测的难点进行了讨论,首先,提出了一种多尺度融合策略,利用特征提取网络输出特征图逐级缩小的特性构建特征金字塔,通过自顶向下和自底向上的两次融合,使得最后输出特征包含更多的语义信息和位置信息,增强了特征的鲁棒性,提升了算法对小尺度人脸的敏感度。其次,对锚框的表征方式进行改进,增加候选框的推荐尺度,同时将多尺度融合的特征金字塔各层输出与合适尺度的锚框相匹配,提升常规人脸和小尺度人脸的召回率。最后,为缓解训练过程中正负样本不均衡问题,采用了在线难例挖掘方式,对样本中的难例进行挖掘,通过回传方式进行多次学习,增强模型对难例的检测能力。
其他文献
党的十九大报告提出了中国发展新的历史方位,城市活力发展研究随之成为政府和学术界热点的研究领域之一。2018年10月,习近平总书记在视察广东省期间,曾明确要求广州实现“老城市新活力”,广州省应提升城市的综合实力,并在国际化方面有所建树。习总书记充分了解我国城市的发展规律,能充分认识到我国城市发展的新趋势,从而对广州这样的一线城市提出了这一项重大战略课题。为了探讨新时代城市活力的影响因素以及影响机制的
在分布式网络架构下,网络设备在进行业务流量的路由转发过程中,依据邻居节点交互信息,独自完成网络的控制与转发工作。这种控制与转发紧密耦合,设备间各自为战的网络架构在进行网络管理配置,网络灵活化部署时都面临巨大挑战。软件定义网络(Software Defined Network,SDN)通过解耦网络的转发与控制层面,设立集中化的控制中心,能够全局性的获取网络拓扑信息,全局化统一管理网络。新一代的5G(
近年来,各类应用软件层出不穷,软件开发规模越来越庞大,软件测试前期的准备工作作为软件正式投入使用前,保证软件高质量和高可靠性的重要手段,变得越来越重要,测试用例自动生成成为软件测试前期阶段降低测试成本和提高测试效率的关键和难点。高效的测试用例自动生成技术旨在生成尽可能少的测试用例,尽可能的覆盖软件测试需求。因此,测试用例生成技术的难点在于如何自动生成高覆盖率的测试用例数据,以及如何确定有效的测试停
AGV(Automatic Guided Vehicle,自动导引车)作为柔性的自动化搬运设备对智能物流和工业4.0的发展具有重要的促进作用。其中路径跟踪是AGV实现高精度控制的核心技术,也是AGV在很多工业领域推广应用的难点。为了解决未知参数带来的建模困难以及避免大量的人工试验工作,本文针对激光导航AGV(Laser-guiding Automatic Guided Vehicle,LAGV)设
在工业实际生产过程中,为了系统可以稳定运行,通常会对状态或者输出进行约束,若不对其进行约束,系统的动态性能将会受到影响,严重的情况下还会对元器件产生破坏,所以在对控制器进行设计时,考虑约束是十分必要的.众所周知,与时间驱动的控制方法相比,事件触发控制(ETC)在减少能耗和降低传输带宽占用率上具有优越性.然而,传统的事件触发控制研究均基于闭环系统是输入状态稳定(ISS)这一假设,如何摆脱ISS假设对
作为新型的储能设备,超级电容器以其较高充放电效率、高功率密度、长循环寿命和良好的操作安全性等优点备受关注。超级电容器常用的电极材料包括碳材料、金属氧化物/氢氧化物
日前,教育部和国家体育总局正在联合进行大学生体育测试的普查,对比上世纪80年代大学生身体素质,看看今日大学生的身体素质下滑有多明显。从数据上可以看出,学生各个身体素质
浅色透明氧化锡锑(antimony-doped tin oxide,简记作ATO)抗静电剂是一种新型纳米功能材料,具有优良的导电性与可见光透过性,其独特的性能赋予它广阔的应用前景。目前常用的ATO抗静电剂通常为颗粒状粉体或浆料,须在较高用量下才能形成导电通路,起到抗静电的作用。样品用量的增加,不仅使生产成本升高,而且会造成其在某些领域的应用受到限制,尤其是在对透明度和导电性要求较高的应用场景,如建
随着大数据、云计算等信息技术的发展和数据规模的增长,系统对计算能力的需求正逐步加大,传统的通用CPU已无法满足复杂算法和大规模数据的计算需求,CPU-FPGA异构系统正逐步成为高性能计算的主要研究方向之一。FPGA独有的部分可重配置特性可为系统提供不同的功能,但同时该系统中的任务调度和任务放置面临着许多挑战。首先,FPGA中资源碎片化仍较严重且传统任务放置策略未考虑可重配置资源的多样性,导致资源未
水性膨胀型防火涂料由于绿色环保、阻燃效率高、干燥快、施工方便等优点,被人们广泛使用。但水性膨胀型防火涂料仍有一些不足,如涂料形成的膨胀炭层强度低,导致涂料耐火性能不好;涂料的生烟量大,导致涂料遇火时危害大;涂料耐水性能差,导致涂料使用寿命短、遇水时作用小等。因此针对以上的情况,本文分别制备了螺环磷酸根离子、碳酸根离子和硝酸根离子插层的水滑石(S-LDH、C-LDH和N-LDH),以及聚磷酸铵微胶囊