基于通用检测和跨层特征整合的人脸检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sunj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉技术领域的研究进入了深度学习时代后,人脸检测作为计算机视觉领域中一直都在研究的问题,也跟随人工智能技术不断向前发展,深度学习时代的人脸检测算法也可以从跟通用目标检测的关系来从两个不同的角度看待,分别是专为检测人脸目标而设计的检测器,此类算法大多从人脸与其他目标相比而独有的特征出发而设计,另一种就是在通用目标检测算法的基础上,做一定针对于人脸目标的调整,此类算法的设计往往更加简洁,且具备更高的可复用性。人脸检测中提出的方法几乎涵盖了从数据处理到损失设计的深度学习训练的每个部分。这些方法大部分都专注于小尺寸目标的挑战。然而,实际上在通用对象检测中有很多方法,同样专注于解决类似的问题。因此,基于通用检测的人脸检测和特定人脸目标检测算法都在不断向前发展。随着人脸检测算法的效果越来越好,同时也越来越特定于检测人脸目标,比如经典的SSH、S~3FD以及HAMBox里的anchor补偿策略等等。鉴于此,本文基于通用检测模型,设计了一个简单而又实用的人脸检测模型,使其便于使用和复现。在此之前,基于通用检测模型Retina Net设计的人脸检测模型Retina Face和Tina Face已经在WIDER FACE数据集上取得了较好的成绩。YOLO系列是目标检测领域最为广泛使用的单阶段检测模型,YOLOv5是YOLO系列的最新版本,为了便于比较改进效果和使用复现,我们选择了YOLOv5做为基准,通过对于YOLOv5数据增强模块、网络结构和loss函数的改进,此基础上针对人脸检测的部分特性作出修改,设计一个全新的检测模型。在设计基于通用检测的人脸检测算法时,本文对特征融合网络的改进在人脸检测任务上取得了较好的性能表现,包括将PANet与注意力机制相合并以增加不同分辨率特征融合的有效性,增加一个尺度的特征图,也对各个尺度的检测精度带来了一定程度的提升,因此本文从特征融合网络的角度出发,在基于通用检测的人脸检测模型的基础上继续作出改进,增加不同层次特征的之间的跨层连接,提高特征融合的效率,改善尺度差距过大的人脸目标的检测效果,并通过实验验证了这一策略的有效性。
其他文献
点击率预测任务在推荐系统与计算广告行业有重要的意义,然而以往的方法大多需要人工设计算法模型,需要大量的专家知识,费时费力。为改善这一问题,本文提出使用自动机器学习技术实现点击率预测模型的自动化设计,实验证明了所提出的方法相较于人工设计的方法有更好的稳定性与预测能力,同时,本文在原有基础上对搜索过程做了进一步优化,提高了预测准确性。首先,本文总结了常用的点击率预测的微操作,构建了基于cell的搜索空
学位
叶孔菌属是隶属于担子菌门、蘑菇纲、锈革孔菌目、锈革孔菌科的一类大型木生真菌,在民间具有药用的传统。近年来叶孔菌属多在中国地区被发现,其中雪柳叶孔菌和暗色叶孔菌被认为是该属中主要的两个药用真菌物种。尽管某些医学研究已经承认了叶孔菌的药用功能,但目前对叶孔菌的认知还远远不足以支撑对其进行商业化的生产活动。本研究通过单因素实验、PB试验、最陡爬坡实验以及三因素三水平响应面实验实现了对叶孔菌液体发酵培养基
学位
乳腺癌是在女性群体仅次于皮肤癌的癌症。随着医学技术的发展,超声诊断(一种使用声波产生体内结构图像的成像方法)为乳腺疾病和状况的诊断以及对治疗的指导提供了非常有价值的信息,而这些重要信息有助于医生对患者的病情做出更合理的诊治,从而提出更有效,更有针对性的治疗方案,降低误诊率,从而降低肿瘤对患者生命的影响。BI-RADS乳腺肿瘤分类总共包含有BI-RADS 0-6这几类,其中BI-RADS 4类又可以
学位
乳腺癌在全球已经成为一种非常严重的影响女性健康的疾病。研究发现,尽早发现和尽早治疗能够极大的挽救乳腺癌病人的生命。由于地区医疗水平不同和医生经验多少的影响,乳腺癌的诊断仍面临着许多问题。利用乳腺超声影像可以辅助医生进行乳腺癌的诊断,为了排除医生的经验和能力对最终诊断结果的影响,人工智能可以对超声影像进行辅助分析。其中,乳腺超声图像的分割的准确性对于人工智能的辅助能力有较大影响。大部分研究者都只是集
学位
细胞自噬是一种溶酶体依赖的细胞组分程序性降解通路,在进化中高度保守。细胞自噬通过将受损细胞器和错误折叠蛋白质等物质降解,一方面可以消除这些受损细胞器或蛋白质对细胞的不利影响,另一方面通过对这些物质的重新利用满足细胞的物质能量代谢需求。哺乳动物成体心肌细胞通常被认为是一类终末分化的细胞,几乎没有自我更新能力,通过细胞自噬实现细胞蛋白质和细胞器的自我更新对于维持心肌细胞的存活和稳态更为重要。在过去的十
学位
随着语音技术的飞速发展,深度语音伪造变得越来越方便,这项技术也从高门槛逐渐走向大众,让充满创意的深度伪造语音变成大众娱乐。但在深度伪造语音方便大众的同时也混淆着大众视听,基于深度学习的语音伪造技术让听起来真实的消息不再真实,使得重要的视听消息变得难以让人相信,影响了大众生活,甚至造成财产损失和威胁生命安全,因此,深度伪造语音的检测变得尤为重要。首先,提出加强小波包能量谱,并融合语音特征提取的多种方
学位
位移是结构健康监测的重要指标,广泛用于评估结构的健康状况。考虑到传统位移传感器的局限性,近些年来,研究者们提出了大量基于视觉的方法来进行结构位移监测。与传统位移传感器相比,基于视觉的方法具有远距离、非接触、易部署、成本低等诸多优点。目前基于视觉的结构位移监测方法主要分为三个步骤:首先,通过相机标定方法获得二维图像与三维世界的映射关系,然后通过视频目标跟踪技术获取到目标建筑在视频中的像素位移,最后将
学位
近年来,电子商务如雨后春笋般不断发展壮大,其涵盖面越发广泛,并迅速引领社会发展潮流,电子商务行业已成为国民经济发展的一支坚实力量。自2020年1月月末,新型冠状病毒肺炎疫情进入了大规模爆发期,在这一艰难时段,电子商务的线上运营优势也逐渐显现出来,电商行业所受到的复工影响程度相比其他行业较低,其更高的复工率令其他行业望尘莫及。电商网络具有网络异构性,异构网络表征学习及用户社区划分是挖掘电商网络异构信
学位
生物通路对于研究疾病致病性有重要意义,它对于识别药物靶点和改善疾病临床的治疗效果有着指导意义。高通量测序技术的不断完善,使得生物通路数据被大量积累,因此如何从繁杂冗余的数据中有效提取生物通路信息是当下迫切需要解决的难题。当前存在不少生物通路知识库提供给研究人员通路可视化和生物通路检索功能,还有个别的生物通路知识库能够根据各种用户需求提供差异化的通路排序结果,且检索结果能够按照用户习惯动态更新,但是
学位
近年来,随着计算机技术的不断发展,人工智能领域的研究突飞猛进。其中图卷积神经网络已经成为学习复杂结构与性质之间的关系等应用的一个非常有效的框架。图卷积神经网络在图结构数据上表现出来了非常优异的性能,因此越来越多的研究者开始聚焦于该方向。在诸多方向中由于使用图卷积神经网络进行分子属性预测在分子生成和药物发现等领域起到极为关键的作用,分子属性预测成为了越来越热的研究方向。在化学领域,计算分子的属性通常
学位