论文部分内容阅读
为了避免景深和遮挡的干扰,提高人群计数的准确性,采用了LeNet-5,AlexNet和VGG-16 3种模型,提取图像中不同景深目标的特性,调整上述模型的卷积核尺寸和网络结构,并进行了模型融合。构造出一种基于多模型融合的深度卷积神经网络结构,网络最后两层采用卷积核大小为1×1的卷积层取代传统的全连接层,对提取的特征图进行信息整合并输出密度图,极大地降低了网络参量且取得了一定提升的数据,兼顾了算法效率和精度,进行了理论分析和实验验证。结果表明,在公开人群计数数据集shanghaitech两个子集和UC