基于卷积神经网络的人脸检测若干问题研究

被引量 : 0次 | 上传用户:braveheart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在各种计算机视觉任务中取得了巨大的成功,人脸检测作为计算机视觉中的重要研究方向,其性能也得到了不断的提高。在人脸检测的应用场景中会存在很多限制因素,对人脸检测的性能带来极大的挑战,例如尺度、表情、姿态、遮挡、光照、模糊等。本文详细阐述了基于卷积神经网络的人脸检测的工作进展,以进一步提升检测性能为目标,提出了若干人脸检测方法。本文的主要工作包括以下三个方面的研究内容。1.随着人脸尺度的减小,基于卷积神经网络的检测器性能急剧下降。针对小尺度人脸检测性能不佳的问题,提出一种新颖的多尺度人脸检测器。该方法的创新点在于从四个方面关注小尺度人脸:构造多分支检测架构,将保留更多小尺度信息的浅层作为检测层;设计了尺度敏感锚框,更小的锚框用于匹配小尺度人脸,从而扩大了锚框尺度的覆盖范围;添加特征融合模块,利用相邻高层分支的特征辅助检测小尺度难检测人脸;同时采用多尺度训练和多尺度测试策略,使所提模型对各种尺度都具有鲁棒性。2.现有锚框匹配方法采用固定阈值划分正样本。然而,极端纵横比人脸与锚框的最大交并比往往低于正样本阈值,从而导致采样失败。锚框补偿虽然可以缓解采样不充分,但无法保证补偿样本质量和正样本整体质量。针对极端纵横比人脸采样不充分的问题,提出了一种广域纵横比匹配策略,从更广泛的人脸纵横比范围收集具有代表性的正样本锚框。该方法的创新点在于为极端纵横比人脸构造可变的正样本采样域值。在保证正样本整体质量的前提下,可以获得许多与极端纵横比人脸相关的高质量正样本参与训练。此外,设计了感受野多样化模块,在特征增强阶段获得更加鲁棒的人脸特征。3.基于卷积神经网络的人脸检测遵循监督学习模式,它的检测性能依赖于训练数据集的标注质量。然而,现有的人脸检测数据集均是人工标注的,很难保证每张人脸的标注质量。针对训练集人脸边界框标注不准确的问题,提出了边界框深度校正的方法。该方法的创新点在于借助深度模型预测的人脸边界框来识别并替换训练集中未对齐的人脸标注。使用校正后的标注来训练检测模型,会降低模型的回归损失。进而打破原有分类损失和回归损失的平衡,使模型在训练阶段更加专注于降低分类损失。
其他文献
架空线路是国家电力系统中负责电能输送的一个重要组成部分,长期经历着风吹日晒、电闪雷击、雨雪、污秽及沉陷等外界环境因素的侵害。而绝缘子作为架空线路最核心的元器件之一,关系到输电线路能否可靠运行,因此,对绝缘子自爆缺陷的检测尤为重要。本文针对现有绝缘子缺陷检测方法存在的作业周期长、效率低、安全性低等问题,结合新型人工智能技术设计基于卷积神经网络的绝缘子缺陷识别系统,实现了快速、准确的绝缘子缺陷检测功能
学位
随着经济的全球化和我国经济的迅速发展,金融信贷业务也越来越繁荣,已经成为商业银行主要的盈利手段。然而,商业银行若误判了借贷者的信用情况,会导致一定程度的经济损失。因此,商业银行的信用风险管理水平是其业务竞争力水平的重要体现。信用评估是信用风险管理的核心。当前各种信用评估模型均对不同的借贷者存在一定程度的偏见(可能是人为的偏见,也可能是模型的偏见),导致商业银行在使用信用评估模型进行信贷决策时偏爱或
学位
中国自改革开放以来,经济高速发展,综合实力不断提高。良好的经济基础为科学技术的井喷式发展提供了物质保障。世界AI技术的持续发展,5G技术开启了第四次工业革命的浪潮。伴随着网络技术的发展,人们关注的焦点已经不在于人与人之间的链接,人们迫切需要解决人与物,物与物之间的联系。5G技术的出现极大地满足了人们迫切的需求,其更加面向工业互联网及多场景提供专网相关服务的技术优点是其它技术所不能比拟的。因此如何更
学位
VLC是利用波长范围在380nm到750nm之间的可见光波段进行数据调制的通信方式,由于无需频谱许可、可兼顾照明、保密性好和系统速率高等特点,成为6G室内覆盖的候选方案之一。为了提高传输速率,VLC通常采用修正的OFDM调制方案,为了进一步提高频谱效率,有人提出将OFDM和CDMA两种调制技术结合起来的MC-CDMA调制移植到VLC系统。本文针对基于ACO-MC-CDMA调制的VLC系统,研究了接
学位
改革开放后,带有“中国制造”标签的产品开始出现在国际市场,“中国制造”形象不仅代表着中国制造业水平,也向世界讲述着中国发展建设成就的故事。《朝日新闻》作为日本主流报刊媒体,在日本拥有巨大的影响力,其新闻呈现及话语特征具有重要的研究意义,通过考察《朝日新闻》“中国制造”新闻样本,试图了解“中国制造”在日本媒体的形象呈现,并在此基础上分析“中国制造”媒介形象的形成原因,提出“中国制造”国际传播的思考。
学位
面对复杂场景时,人类会调用多种感官去感知并搜寻目标物体,进而完成各种操作。同样对于机器人而言,当处于非结构化的现实环境中时,仅仅依赖单一模态很难完成复杂的感知操作任务,例如仅视觉条件下无法分辨物体的软硬度及纹理。为了提升自身的感知能力,智能机器人需要在理解人类意图的基础上,利用多源传感器(深度相机、声音传感器、触觉传感器等)构建的多层次感知通路捕捉物体的异构模态信息,并结合高性能的信息处理中心和高
学位
随着5G商用化部署及下一代移动通信研究的全面展开,网络能量效率在大规模MIMO系统中的重要性逐渐突显,低精度量化信号重构技术作为降低系统硬件开销与功耗的重要手段,在实际部署时仍面临算法复杂度高、鲁棒性较差、数字同步困难等挑战。本论文面向低精度量化技术与大规模MIMO、OFDM技术深度融合的场景,对大规模机器类型通信网络接入、信道估计以及OFDM链路自适应传输方案等关键问题展开研究。首先,总结低精度
学位
智能设备和5G网络的普及推动了视频信息与人的交互方式和速度,使得视频成为人们生活中难以缺少的一部分。但技术的发展也使视频信息的获取和修改变得更加简单,对视频信息的安全造成了威胁。为了保证视频信息的安全性,视频信息隐藏技术应运而生。其中基于编码标准的信息隐藏技术的应用更加广泛,VVC(Versatile video coding,VVC)是最新公布的视频编码标准,比之前的编码标准能提升一半的性能。考
学位
随着通信技术与信息技术的快速发展,智慧交通作为有效提升交通综合治理能力、确保出行安全、加快城市可持续性发展的重要手段,得到了学术界与产业界的广泛关注。特别是近年来,“交通强国建设纲要”提出“构建安全、便捷、高效、绿色、经济的现代化综合交通体系,加快建设保障有力、世界前列的交通强国”的目标进一步推动我国交通系统向现代化、综合化、智能化方向发展。作为智慧交通系统的“中枢系统”,高速移动通信系统负责承载
学位
目的:本研究使用黄芪建中汤加减联合常规西药治疗脾胃虚寒型十二指肠溃疡伴幽门螺杆菌感染的患者,通过评价中医证候疗效、内镜下黏膜修复情况、Hp根除率和血清IL-6、GAS-17、PGⅠ、PGⅡ水平变化情况等方面,探讨黄芪建中汤治疗本病的疗效,验证其可行性和安全性,以期在本病的治疗上提供更有效的方法。方法:将收集到的十二指肠溃疡伴幽门螺杆菌感染的68例患者资料进行整理,依照随机数字表法进行分组。对照组中
学位