【摘 要】
:
针对公共场所口罩佩戴检测存在遮挡、密集和小尺度的情况而导致检测精度不高的问题,以实时目标检测算法YOLOv3为基础提出一种Mask-YOLO算法.首先在特征融合过程中引入通道注意力机制以突出重要特征,减少了融合后冗余特征的影响,有效提高了特征利用率;然后以完全交并比(complete intersection over union,CIoU)损失代替均方差损失(mean square error,MSE)作为边框回归的损失函数,提高了定位精度;最后除了检测佩戴和未佩戴口罩的情况外,还对不正确佩戴口罩的情况
【机 构】
:
华北理工大学人工智能学院,河北唐山063210;华北理工大学河北省工业智能感知重点实验室,河北唐山063210;华北理工大学人工智能学院,河北唐山063210
论文部分内容阅读
针对公共场所口罩佩戴检测存在遮挡、密集和小尺度的情况而导致检测精度不高的问题,以实时目标检测算法YOLOv3为基础提出一种Mask-YOLO算法.首先在特征融合过程中引入通道注意力机制以突出重要特征,减少了融合后冗余特征的影响,有效提高了特征利用率;然后以完全交并比(complete intersection over union,CIoU)损失代替均方差损失(mean square error,MSE)作为边框回归的损失函数,提高了定位精度;最后除了检测佩戴和未佩戴口罩的情况外,还对不正确佩戴口罩的情况进行了检测.实验结果表明:与YOLOv3算法相比,Mask-YOLO算法在每秒帧率(frame per second,FPS)仅下降1%的情况下使平均精度均值(mean average precision,mAP)提高了4.78%.与其他主流的目标检测算法相比,Mask-YOLO算法在复杂场景下对口罩佩戴检测也有更好的效果和鲁棒性.
其他文献
针对用于太阳磁场精确测量的中红外观测系统(Accurate Infrared Magnetic field Measurements of the Sun,AIMS)望远镜8~10μm真空制冷成像终端系统的高精度装调需求,提出了一种基于中红外可调谐激光光源的宽谱段干涉检测和装调方法.首先,采用泰曼-格林干涉仪,利用参考臂可调的优势,弥补光源相干性不足的缺陷,从而实现8~10μm宽谱段的干涉测量.其次,完成了干涉仪光学系统设计,可同时兼顾8~10μm和可见光双波段的波前质量,解决了肉眼不可见给干涉仪自身装调
2015年9月28日月基光学望远镜(Lunar-based Ultraviolet Telescope,LUT)在任务期间经历了唯一一次完整的月全食过程,为研究地球对太阳光的几何遮挡是否会对月面辐射环境产生影响提供了难得机遇.首先,利用月食期间连续长达2 h 27 min的电荷耦合器件(Charge-Coupled Device,CCD)天文观测图像,统计分析了月食期间的宇宙线事件计数,发现月食期间宇宙线计数不存在明显变化,在30 s曝光时间内,宇宙线事件平均计数为129.27(±15.78);其次,分析
提出了一种基于Pre-LN Transformer的静态多模态情感分类模型.该模型首先利用Pre-LN Transformer结构中的编码器提取评论文本中的语义特征,其中编码器的多头自注意力机制允许模型在不同的子空间内学到相关情感信息.然后根据ResNet提取评论的图像特征,在特征水平融合的基础上通过视觉方面注意力机制来指导文本的情感分类,实现在线评论的静态多模态情感分析.最后在Yelp数据集上执行情感分类的实验结果表明:所提出的模型在准确率上相比于BiGRU-mVGG、Trans-mVGG模型分别提高了
望远镜的仪器偏振效应主要由金属镜面的反射偏振引起,是当前高精度天文偏振测量面临的主要技术问题.为了消除仪器偏振对偏振测量精度的影响,在实验室对金属镀膜材料的偏振特性进行精确全面的测量研究显得至关重要.针对保护铝膜提出一种偏振特性测量方法,该方法使用两种光电调制方式对保护铝膜的缪勒(Mueller)矩阵关键元素进行直接测量,并基于双层膜的结构模型,使用多入射角多波长的测量数据在不依赖色散模型以及参数假设的情况下反演光学参数.反演结果与传统方法得到的结果一致,同时本文方法能够对偏振特性进行更好的表征.
湿地是地球上最重要的生态系统之一,在维持全球生态环境安全等方面发挥着举足轻重的作用.由于湿地独特的水文特征,传统的湿地监测需要耗费大量的人力和财力,对于大尺度的湿地信息提取更是困难重重.随着大数据和云计算的兴起,为大尺度和长时间序列的空间数据处理提供了契机.本文基于Google Earth Engine(GEE)云平台,使用Sentinel-1合成孔径雷达(SAR)数据、Sentinel-2光学数据以及地形数据,探讨了红边、雷达以及地形特征对大范围区域沼泽湿地提取的重要性,验证了利用JM距离寻找沼泽湿地提
针对目前大多数脑电波情感识别方法存在的依赖手动特征提取等问题,提出一种基于卷积神经网络(convolutional neural network,CNN)和双向长短时记忆(bidirectional long short-term memory,Bi-LSTM)网络的混合模型.首先将一维数据转换为二维数据,采用CNN提取空间特征;然后将一维数据输入Bi-LSTM,获取时间特征;最后将融合的空间和时间特征输入Softmax分类器,得到最终分类结果.在DEAP数据集上的实验结果表明:CNN和Bi-LSTM混合
传统谱聚类的高光谱影像波段选择模型中,采用的波段相似矩阵受到噪声或异常值的影响且仅能表征波段的单一相似特征,导致波段子集的选取结果受到限制.本文从波段选择的目的 出发,提出鲁棒多特征谱聚类方法,整合多个特征的波段相似矩阵来形成综合相似矩阵以解决上述问题.该方法假设4种相似性度量包括光谱信息散度、光谱角度距离、波段相关性和拉普拉斯图谱能够共同揭示波段聚类的内在结构特征,通过构建低秩稀疏矩阵分解模型来表征单一相似矩阵与综合相似矩阵的内在关系.进一步,采用增强拉格朗日乘子算法来优化求解综合相似矩阵,利用常规谱聚
研究了Windows操作系统中内核钩子的保护原理,并针对交互式反汇编器交叉引用功能的不足,提出了一种深层次内核钩子挖掘算法.首先用该算法挖掘出指定内核函数的内部调用以及包含钩子的内核函数的所有被调用位置,然后用Python编写基于函数调用原理的挖掘算法,最后用C++编写过保护实验的驱动程序.研究结果表明:过保护实验是成功的,证明了该挖掘算法的有效性和挖掘结果的全面性.
针对场景图像的细粒度分类任务,结合图像视觉和文本的多模态信息提出了一种基于注意力网络推理图的细粒度图像分类方法.首先提取场景图像的全局视觉特征、局部视觉特征和文本特征,把位置信息分别嵌入局部视觉特征和文本特征后拼接成新的特征,再将这个新的特征作为图结构的节点生成一个异构图;然后设计两条元路径将异构图分解成两个同构图,并将其分别放入设计有节点级注意和语义级注意的两级注意力网络推理图;最后将输出的节点特征与全局视觉特征进行多模态融合操作,获得更丰富的细粒度特征表达.所提出的模型实现了多模态融合与图注意力网络的
针对红外和可见光图像在融合过程中存在质量低下、信息缺失、边缘细节不突出等问题,提出一种基于非下采样轮廓波变换(non-subsampled contourlet transform,NSCT)与稀疏表示的压缩感知图像融合重构算法.首先利用NSCT进行源图像分解,得到相应的高频子带和低频子带图像;然后针对高频子带部分,利用基于压缩感知的高频融合规则进行融合,得到高频融合系数;针对低频子带部分,按照基于字典学习的低频融合规则进行融合,得到低频融合系数.最后进行NSCT逆变换得到融合影像,实现红外和可见光图像的