基于注意力卷积神经网络的人群计数算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：tandr001

【摘要】

：

随着社会的快速发展及城市化进程的加速推进,近年来公用和民用视频监控数量保持海量增长。为更高效快速地利用视频数据,许多国家开始系统地研究智能视频监控技术。人群计数作

【作者】

：

张友梅

【出处】

：

山东大学

【发表日期】

：

2004年期

【关键词】

：

人群计数卷积神经网络辅助训练机制注意力机制尺度自适应

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着社会的快速发展及城市化进程的加速推进,近年来公用和民用视频监控数量保持海量增长。为更高效快速地利用视频数据,许多国家开始系统地研究智能视频监控技术。人群计数作为智能视频监控系统的重要任务之一,在公共安全及商业领域都有十分重要的理论和应用价值,近年来已经成为机器视觉和人工智能领域的研究热点。随着学术界和工业界对该问题的研究,人群计数算法的计数准确度已经有了明显的提高,但在实际应用中仍面临较多挑战:在实际场景中,视频监控采集到的视频图像中往往存在复杂背景,其中部分特殊背景与人群或人头形态相似,易被误判为人群;人群中个体自由度较高,导致人群分布杂乱且密度差异大,增加了计数难度;受拍摄距离及角度的影响,视频监控中人头尺寸也存在较大差异,影响了人头区域定位的准确性。以上三个问题都严重影响了人群计数的准确度。本文依次针对以上三个挑战对人群计数算法进行了研究,主要内容及创新点归纳如下:1.针对人群图像复杂背景下出现的个体差异问题,设计了对图像块表观特征进行分类的辅助训练任务,形成了辅助训练机制的人群计数方法,有效缓解了人群目标误判的问题。该计数方法的创新点可归纳为:(1)计数整体流程避免了前景分割、人头提取等复杂任务,仅需对全局图像进行分块。(2)该计数方法基于卷积神经网络设计了端到端的训练结构,避免了传统机器学习算法中人工特征提取和回归模型设计等耗时耗力的任务。(3)根据人头朝向等表观特征所设计的辅助训练任务与人群计数任务实现参数硬共享,在网络训练过程中提取到多语义信息并有效辅助网络在空间中关注人头位置,从而提高了人群计数的准确度。2.针对图像中的复杂背景将注意力模块应用于人群计数,形成了人头注意力机制的人群计数方法,有效过滤了图像中的非人头信息。该计数方法的创新点可归纳为:(1)在传统的注意力模块基础上进行了改进并首次应用于人群计数领域。注意力模块与卷积神经网络的结合可指导网络关注人头位置从而有效过滤图像中的非人头信息,因此该网络对复杂背景具有鲁棒性。(2)为提高对稀疏人群的计数准确度,设计了相对误差损失函数,提升了稀疏人群样本在网络训练过程中的重要性,从而提高了对稀疏人群数据生成密度图的清晰度和准确度。3.针对人群杂乱分布这一挑战,延续了辅助训练思想并设计了结合空洞卷积和多个注意力机制的多分辨率注意力模块,有效提升了人群计数的准确度。该人群计数方法的创新点可归纳为:(1)将密度等级分类和人群计数任务训练所得的多语义特征进行级联,对人群杂乱分布而导致密度不均的情况具有鲁棒性。(2)将注意力模块进行改进,基于连续卷积层的特征分别生成注意力图并将其加和来强化人头位置的特征。(3)结合改进的注意力模块和空洞卷积操作设计了多分辨率注意力模块。其中的空洞卷积操作以较少的参数学习到具有更大感受野的特征,一方面为注意力图的生成提供更丰富的信息从而更准确地定位人头区域,另一方面可获取全局信息,提升网络对杂乱人群的鲁棒性。4.针对人头尺寸差异问题,利用AlexNet的特征提取能力融合了多个卷积层的特征进行人群计数,增强了网络处理多尺度目标的能力。另外,设计了可提取更多不同感受野特征的多尺度自适应网络,该网络可根据不同输入自适应加强具有对应感受野大小的特征通道,降低了弱相关特征通道的竞争性。尺度自适应人群计数网络的创新点可归纳为.:(1)设计了由传统卷积分支和空洞卷积分支组成的尺度扩大单元,单个尺度扩大单元可提取具有两种不同感受野的特征。(2)采用密集连接模式将多个尺度扩大单元进行连接,进一步增大了感受野范围,同时使感受野在一定范围内分布更密集,因此可有效处理图像或视频中人头尺寸差异问题。(3)设计了通道注意力单元来针对输入图像中不同的人头尺寸有选择性地增强具有合适感受野的特征通道,有效缓解了不同特征通道间的竞争所导致的负面影响。5.为探究不同模态数据在网络训练中对网络贡献的差异,本文设计了模态加权神经网络,可在网络训练过程中自适应提高重要模态数据的权重。另外,该网络是尺度自适应网络中通道注意力单元的设计基础。该网络的创新点可归纳为:(1)在自动编码器的基础上设计了结构化正则项,指导网络在训练过程中为不同模态的数据分配权重,从而学习不同模态数据对网络贡献的差异,因此更有效地利用了多模态数据。(2)该网络适用于具有多种模态输入的分类任务,可根据不同任务设置网络超参数并基于多模态数据进行训练,具有普适性。

其他文献

酶联免疫吸附方法测定人唾液中葛根素、栀子苷浓度及其药代动力学

研究目的：1建立健康人唾液中葛根素、栀子苷含量测定的间接竞争ELISA方法,对该方法进行适用性考察,为中药及其复方微量或痕量活性成分在人体唾液中药物浓度分析及药代动力学研

学位

葛根素栀子苷唾液间接竞争ELISA药代动力学健康志愿者

我国上市商业银行治理效率及其影响因素分析

随着社会经济的发展，商业银行对金融服务的提供、信用的创造、经济的调节、信用的中介以及支付功能，在全球的金融体系活动中越来越重要。商业银行已经是最重要的交易中介和资金

学位

上市商业银行治理效率影响因素

静松灵对体外大鼠脑神经细胞的麻醉影响研究

本实验以离体培养神经元细胞为研究模型,模拟麻醉过程中大脑皮层神经元所处环境,通过对神经递质及信号转导通路相关指标的测定,探究静松灵麻醉剂对中枢神经系统的麻醉效应机

学位

麻醉机理静松灵神经递质信号转导神经细胞培养

基于文化交往,选择壮族神话英译策略

壮族神话博大精深,英译壮族神话是让世人知晓和了解壮族神话的有效途径之一。壮族神话英译是一种文化交往行为,英译中所选用的翻译策略应该以能否促进文化交往为目的和归宿。

期刊

壮族神话英译策略文化交往

探究式教学模式下小学数学课堂设计及实践研究

随着基础教育课程改革的发展，探究式教学逐渐成为备受关注的焦点．随着素质教育大力提倡，教育要求人全面发展，“探究”更是培养创新精神和实践能力的重要途径．探究式教学作为一种新

学位

小学数学探究式教学案例研究教学策略

柳氏广意派推拿术治疗小儿肌性斜颈2例

本文阐述了小儿肌性斜颈的病因病理,以及运用柳氏广意派小儿推拿摩方"外关手里痉病摩方""肩髃膏肓濡筋摩方"治疗小儿肌性斜颈的经验。

期刊

小儿肌性斜颈柳氏广意派推拿术柳少逸

异位促肾上腺皮质激素综合征1例

1临床资料患者男性,68岁,因“发现血压升高3个月,全身乏力2周”于2014年9月6日以“高血压”入住成都中医药大学附属医院(我院)心内科治疗,入院前3个月,患者偶测血压发现升高,

期刊

高血压库欣综合征肺癌

不同加热温度和降温速率对含蜡原油析蜡点的影响

利用差示扫描量热法（DSC）对原油的析蜡特性进行分析,并得到了析蜡过程的热谱图和dh/d T-T曲线。以大庆原油为研究对象,对dh/d T-T曲线进行分析,探讨了加热理温度、温降速率对析

期刊

析蜡点加热温度降温速率差示扫描量热法

二战后英国写实艺术研究

在第二次世界大战余波未消的20世纪中叶的英国,新一代本土艺术家群体开始对本国自19世纪以来显得沉默无闻的艺术现状进行了深刻的反思并采取相应的行动,试图运用全新的艺术理

学位

英国现代风格写实主义谢尔维斯特伦敦画派弗朗西斯·培根卢西安·弗洛伊德

“四联五动”打造校企合作升级版——“北仑模式”的探索与实践

以产教融合为背景,以系统论、产教融合生态圈理论为支撑,以职业教育发展需要为诉求,以政府政策为导向,依托区域优势,明确政府、学校、企业、行业、园区的角色地位,整合优势资

期刊

“四联五动”校企合作产教融合

基于注意力卷积神经网络的人群计数算法研究

与本文相关的学术论文