基于多模型深度卷积网络融合的人群计数算法

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:shy712108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉与模式识别任务中一个热点的研究课题,人群计数和密度估计无论现在还是未来都有着广泛的应用,如智能监控、交通管理以及公共安全等。近年来,研究学者已有大量的关于人群计数领域的创新和研究工作,但是仍面临严重遮挡、密度不均匀、极度拥挤等诸多挑战。因此,为了改善当前的人群计数准确性较低的状况,提出了一种鲁棒性强的基于深度学习的人群计数方法。针对不同景深和遮挡干扰影响人群计数准确性的问题,首先根据LeNet-5、AlexNet和VGG-16三种经典网络模型在提取图像中不同景深目标的特性,调整三种模型的卷积核尺寸和网络结构,分别对不同大小的感受域进行局部感知,捕获图像中不同尺度的人头部特征以提高计数精度。然后,构造出一种基于多模型融合的深度卷积神经网络架构,并且网络的后端配置滤波器大小为1×1的卷积层代替传统的全连接层,对提取的特征图做线性加权,兼顾了人群计数算法的精度和效率。最后,通过提出的网络模型输出估计密度图和人数的预测值。大量的实验表明,在公开人群计数图像集上本文提出的人群计数方法均实现了比现有传统方法更出色的计数结果。同时,设计迁移学习实验以验证构造的人群计数网络架构具有良好的泛化能力。近期,新颖的人群计数方法层出不穷,但始终不能完美地处理尺度变化问题。为进一步改善人群计数的性能,受启发于感受域块(RFB)对目标检测任务的显著提升,我们将VGGNet模型、感受域块模型和膨胀卷积模型融合进行人群计数算法研究,可以更好地模拟人类真实视觉系统中的感受域。然后对于场景中人群计数提出一种基于膨胀卷积的多尺度网络,通过学习图像中多尺度上下文信息,实现了精确且快速的人群计数。提出的网络前端是VGG-16的前十层,然后将感受域块模型嵌入网络提取多尺度特征,最后选择一系列膨胀卷积层作为网络后端。先前大多数方法都通过随机分割图像成小块以扩增训练样本,但分块样本区域重复且全局信息部分丢失。网络强化训练阶段中,以完整的图像输入模型架构进行训练,学习了图像中完整的语义信息和空间特征。在常用的基准人群计数图像集上进行了大量实验,结果显示了提出的人群计数方法在性能上优于最先进的方法,并且为验证提出模型的泛化能力进行了对比实验和消融研究。
其他文献
钍作是我国核能可持续发展的潜在资源,也是一种经济合理的核电燃料。它除了在核能方面有很好的利用之外,在其他方面也有广泛的应用,如光学、无线电、航天航空、冶金、化学工
DEM是最重要的国家基础地理信息,开展DEM数据精度评价和误差特征研究,是科学应用这些数据的前提和保障。针对早期研究关注ASTER GDEM和SRTM数据集,对近期公开的ALOS AW3D30和
正交频分复用(OFDM)技术具有频谱效率高、抗多径能力强以及可凭借强大的数字信号处理算法(DSP)补偿系统损伤的能力,而被广泛应用于传统有线与无线通信系统中(如ADSL、WiFi、4
随着信息化的高速发展,信息安全在全社会各领域起着举足轻重的作用,不仅关系国家的政治安全、经济安全、军事安全,还关系每个人的自身利益。经典密码学一直以来在信息安全方
磁力勘探是地球物理勘探领域中发展速度快、应用范围广的一种勘探方法。随着各类无线技术的快速发展,不具备抗干扰能力的磁力仪在测量精度方面已无法满足大型建设与新兴技术
国家的繁荣和发展需要人才,人才的培养在于教育。近些年来提倡大力进行教育改革,在教育改革实践中形成了一种具有代表性的课堂教学的方式便是小组间进行合作学习。但是受大班
INH-α是构成TGF-β超家族的成员之一,能够通过内分泌作用来参与调控绝经过渡期过程中的骨转换;而在先前的报道中发现,INH也有拮抗BMPs功能的作用。然而,BMPs最重要的功能之
利用三维激光扫描仪能够获取三维点云数据,点云数据具有高密度、高精度等特点,因此,在对复杂真实的三维场景进行目标检测时,包含丰富属性信息的三维点云是当前三维目标检测的
服务计算是现在软件的主要形态,在当前服务互联网的环境下,用户的需求是海量而个性化的,每个人的需求各不相同,而且,用户的需求不仅仅是单个需求,还有可能被分解为不同的子需
当今中国,无论是在外交话语的表述方面,还是在具体合作的实际开展方面,务实合作或者说务实精神正发挥着日益重要的作用,对于中国来说它不仅是推动国家间合作的一种手段,更是