基于多尺度上下文信息的遮挡行人检测

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hesion001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在遮挡场景下的行人检测一直是计算机视觉中的一个棘手问题,由于被遮挡的行人尺度差异大,可见率低,通常会给检测带来极大的挑战。针对这一问题,本文提出了一种针对行人遮挡检测的模型结构,对基于anchor-free的行人检测方法进行改进。首先设计了一种提取多尺度上下文信息的结构,通过级联多个不同扩张率的卷积层,使用密集连接实现多尺度特征共享,提取各个区域的上下文信息来解决遮挡问题。此外,为了提高特征的可分辨性,使用通道注意力机制对多尺度特征融合进行自适应的调整。实验结果表明,该方法在Caltech行人数据集
其他文献
随着传感器的微型化和网络化,物联网技术在电力系统的应用得到了飞速发展。分散分布的配用电物联网终端数量庞大而又广泛互联,跳脱了传统边界安全的保护范畴,使得物联网终端成为攻击电网的重要目标和跳板。围绕电力物联网终端的安全防护展开研究,首先结合电力物联网的架构,从软硬件、通信等方面归纳了终端面临的安全挑战,总结了终端威胁特征,分析了为应对终端威胁部署的防护机制并指出了其不足;然后根据现有防护漏洞具体分析
期刊
针对大型多面复杂结构件表面打磨、喷涂等处理对自动化、智能化的需求,传统目标检测具有局限性、小目标检测准确度低、速率慢等缺点,本文结合计算机视觉提出一种改进YOLOv3算法的工件喷涂质量检测方法,结合实际工控环境需求,构建喷涂数据集,实现对工件表面迷彩喷涂质量的检测。首先,使用K-means++对Anchor重新聚类生成适合本文的锚框尺寸;通过图像增强技术对数据集进行增强,并对YOLOv3的Dark
期刊
针对单曝光HDR图像生成过程中图像欠曝光区域的细节恢复和图像色彩偏移的问题,提出一种基于pix2pix网络结构的单曝光HDR图像生成算法,采用pix2pix自编码网络结构,利用卷积步长代替池化层简化网络结构,在卷积过程中采用Leaky ReLU激活函数,有效的保留图像的细节信息,并使用绝对误差和余弦相似度函数构建损失函数,使网络能够对图像阴暗区域进行较好的扩展,保证图像色彩不发生偏移。实验结果证明
期刊
为了解决设计面向点云数据的神经网络需要大量人工介入的问题,提出了基于注意力机制和点卷积的神经网络架构搜索方法。首先,针对不同尺度点云的信息融合问题,提出了一种基于注意力机制的多尺度融合模块。其次,针对点云的处理效率问题,设计了基于点卷积的特征提取模块作为候选操作,并与多尺度融合模块组成搜索单元。将多个搜索单元叠加成的神经网络作为搜索空间,并采用基于可微分神经网络架构搜索算法搜索出最优神经网络。在公
期刊
为了有效地获取到更有区别性的跨模态表示,提出了一种基于多负例对比机制的跨模态表示学习方法——监督对比的跨模态表示学习(Supervised Contrastive Cross-Modal Representation Learning ,SCCMRL),并将其应用于视觉模态和听觉模态上。SCCMRL分别通过视觉编码器和音频编码器提取得到视听觉特征,利用监督对比损失让样本数据与其多个负例进行对比,使
期刊
小样本学习是视觉识别中的一个受关注的领域,旨在通过少量的数据来学习新的视觉概念。为了解决小样本问题,一些元学习方法提出从大量辅助任务中学习可迁移的知识并将其应用于目标任务上。为了更好地对知识进行迁移,提出了一种基于记忆的迁移学习方法。首先,提出一种权重分解策略,将部分权重分解为冻结权重与可学习权重,在迁移学习中通过固定冻结权重,仅更新可学习权重的方式来减少模型需要学习的参数。其次,通过一个额外的记
期刊
人体姿态估计是计算机视觉中的基础任务,其可应用于动作识别、游戏、动画制作等。受非局部均值方法的启发,本文设计了非局部高分辨率网络(Non-Local High-Resolution,NLHR),在原始图像1/32分辨率的网络阶段融合非局部网络模块的,使网络有了获取全局特征的能力,从而提高人体姿态估计的准确率。NLHR网络在MPII数据集上训练,在MPII验证集上测试,PCKh@0.5评价标准下的平
期刊
为了研究传统目标检测算法在进行道路小目标检测时效果不佳及漏检率较高等问题,本文提出了一种基于改进YOLOv3的小目标检测方法。首先通过设计新的特征融合结构降低小目标漏检率,并且使用DIOU损失提高定位精确度。同时对YOLOv3算法中的聚类算法进行改进,采用K-means++算法改进聚类先验框中心点的提取,选取更为合适的Anchor Box,用于提高检测的平均精度和速度。在自制混合数据集上对行人及车
期刊
为了解决预训练集和跟踪视频的域不一致性导致跟踪模型判别能力不足的问题,提出了一种基于原型注意力的多域网络目标跟踪方法。以实时多域网络目标跟踪方法为研究对象,在训练过程中引入原型网络提取注意力特征。基于支撑集正负样本得到目标与背景的域特定原型注意力,将其与待跟踪视频的特征图进行逐通道自适应融合,使得模型在大型数据集上得到判别力更强的目标表示,从而增强跟踪算法的性能。在OTB100和TrackingN
期刊
语音驱动人脸生成旨在挖掘语音片段和人脸之间的静动态关联性,进而由给定的语音片段生成对应的人脸图像。然而已有的研究方法大多只考虑其中的一种关联性,且对静态人脸生成的研究严格依赖于时序对齐的音视频数据,在一定程度上限制了静态模型的使用范围。因此,提出了一种基于条件生成对抗网络的语音驱动静动态人脸生成模型(SDVF-GAN)。该模型首先基于自注意力机制构建语音编码器网络以获得更为准确的听觉特征表达,并将
期刊