基于自适应图细化的人群密度计数

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:axrczx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人群密度计数(Crowd Counting)的目的对监控场景中的人群进行数量的预测,同时生成人群密度图来反应当前场景中的人群分布。作为人群管理的第一个也是最重要的部分,自动人群计数可以监视区域的人群密度,并在密度超过指定阈值时提醒管理员进行安全控制。由于近年来世界人口的指数增长导致城市中心化,集体活动愈发频繁,在如此大的人口聚集与流动下,人群计数与分析就显得尤为重要。跟其他计算机视觉的任务一样,人群密度计数面临着诸多的挑战,包括:密集人群相互的严重遮挡,复杂背景的干扰,人群不均匀的分布,场景内与场景外的外观变化,人头大小各异问题与透视问题等等。这些挑战使得这个研究课题异常困难,但也吸引了大量的研究者们前赴后继的投入精力进行深入研究。随着卷积神经网络(CNN)的迅速发展,基于CNN的人群计数模型如雨后春笋般出现,并且取得了可喜的进展。但是这些模型的共同缺点是,他们倾向于用单一固定结构来同等对待不同数据集的整个图像,这样无法应付具有不同人群密度的各种复杂场景。因此,本论文提出了一个基于自适应图细化的人群计数算法,旨在利用不同复杂程度的网络独特的表征能力,来处理不同密集程度的区域。具体研究工作如下:
  (1)通过对现有工作及理论的细致分析,总结了已有算法的优点与缺点。对比发现深层复杂的网络可以处理高密度区域,而浅层简单网络可以在稀疏区域中实现更好的性能,基于此理论针对人群计数提出相应的解决方案。
  (2)设计了一个具有多列浅层结构的粗糙网络,每列由不同大小的卷积核组成,因此每列具有不同的感受野,用来增强学习不同特征分辨率的密度变化的能力。以VGG16为原型,结合可形变卷积(Deformable Convolution),设计了一个深层结构的精细网络,通过加入提出的自适应融合策略,此网络可以有选择地抑制噪声并且自动关注匹配的人群规模,进而极大的提高在复杂场景下的计数准确率。利用这两个网络进一步验证不同复杂程度网络的独特表征能力。
  (3)提出了一个基于自适应图细化的人群计数算法,来发挥不同复杂程度网络各自的优势。首先设计一种称为计数注意的新颖注意机制,它可以在没有先验知识的情况下自动定位输入的密集区域。然后利用复杂网络和简单网络分别处理场景中的密集区域和稀疏区域,来组成模型所需要的完整人群密度图。
  (4)设计了一个平滑网络来处理由于两个网络拼接所导致的生成密度图的割裂,同时提出一种新颖的生成对抗损失函数来使得生成的密度图更加逼真。
其他文献
随着互联网的快速发展,视频已经成为信息传播的主要载体之一。相对于单帧静止图像,视频不仅记录了单帧图像中的空间维度信息,还包含了帧与帧之间的时间维度信息。为了表征和刻画视频中的时间维度和空间维度信息,相关研究人员引入了动态模式的概念。动态模式指视频中表现出复杂空间和运动模式的时空过程,包括动态纹理(如瀑布、火焰)以及运动模式(如面部表情、动作)等。动态模式的生成、判别与表征是视频相关应用的基础,也是计算机视觉领域的热门研究课题。
  国内外的研究人员已对多种应用场景下的动态模式进行了大量的研究,并取得
车联网作为未来无线网络的重要应用场景,已经成为了无线通信领域的研究热点之一。无线信道测量和建模是网络设计的基础,也是信号能否被接收的重要参考标准,特别是当车载通信服务于交通安全相关应用时,信号的正确接收与否直接关乎到个人的生命安全。车载通信的无线链路主要分为两类:车对车通信(Vehicle-to-Vehicle communication,V2V)和车对路边单元通信(Vehicle-to-Infrastructure communication,V2I),其中车对车信道的传播特性已经被广泛研究。本文主要研
夜是静的,静中发出的声响会给人留下格外深刻的记忆,如同听一首老歌,伴随着那熟悉的旋律,当年的景象也会出现在眼前。   记得几年前有一则电视广告,为一款黑芝麻糊做的,是电视广告中的不俗之作。黑芝麻糊在哪座城市叫卖并不重要,这种叫卖声是否准确也不重要,关键是广告体现了夜间叫卖的情景,和城镇夜生活形成一种和谐状态,让人一看就丝丝暖意油然而生。长夜不寐,偶闻叫卖声,无论是在山城石板街头来一碗“炒米糖开水
期刊
随着人们对无线通信传输速度和质量的要求越来越高,如何有效提高无线通信系统的频谱效率成为了学术界和工业界共同关注的焦点问题。多用户MIMO(Multiuser-MIMO, MU-MIMO)是当前无线通信提高频谱效率的关键技术,其在单用户MIMO的基础上利用空分复用大幅度提高了系统的频谱效率,目前MU-MIMO技术已应用到诸如WiFi、LTE等多类无线通信系统之中。制约MU-MIMO空间复用传输的一个核心因素是信道矩阵的条件数,而以波束切换的智能天线具有改善信道条件数的潜力,因此,MU-MIMO系统结合智能天
随着物联网的蓬勃发展和进步,智能城市已经成为一种新兴的范式,它是由无处不在的感知异构网络基础设施和智能信息处理、控制系统组成。于此同时,低成本的无人机正快速走向民用,在国民经济和国家安全的许多领域发挥着巨大的作用。为满足智慧城市中客户对包裹较短交货时间的需求,常使用车辆和无人机协同(车-机协同)来缩短配送时间。然而,车机协作工作模式却对安全通信、实时控制、优化调度算法设计等方面带来了新的挑战。
  传统方法研究的车机协作系统无人机类型只有一种,交付车辆也只是单一的送货卡车,这种合作交付系统在智慧城市
随着虚拟现实(Virtual Reality,VR)的广泛应用,如何提高移动用户终端VR业务体验已经成为当前无线通信的研究热点,VR无线化给无线通信系统的传输带宽和传输时延提出了极大的挑战。在当今主流的无线系统中,5G系统由于具有高带宽、低时延的优势,使得5G上传输VR业务成为现实;但另外一方面,面向室内覆盖(VR主要应用场景)的WiFi系统虽然在传输速率方面得到大幅度提高,但在传输时延方面还没有得到大幅度改善,因此,如何提高WiFi系统的VR业务质量具有十分重要意义和实用价值。本文依托实验室与国内某知名
随着移动设备的日益增多和智慧家庭的逐渐普及,用户对Wi-Fi的覆盖、速率及时延等要求越来越高,Wi-Fi高密集覆盖将变得越来越普遍。目前,由于接入点(Access Point,AP)之间缺乏有效的协作机制,Wi-Fi间干扰冲突将随着覆盖密度增加变得日趋严重,用户将陷入即使Wi-Fi信号强度很强但是连接速率低的困境,从而造成无线资源的浪费,因此AP间进行有效的协作将是密集Wi-Fi发展的必然趋势。现有大多数研究关注在基于信道分配的AP协作,考虑到正交信道数目有限,该协作方式在密集WLAN中不再适用;802.
在资金规模方面的巨大差距,使得民营银行可能在传统业务方面难以占得便宜,只有在与平台商业模式结合的地方才能够获得一定的优势。  近期,苏南银行、华瑞银行、苏宁银行、锡商银行、中联银行等多家以“银行”命名的民营企业,陆续通过了国家工商总局名称预核准。与此同时,20多家上市公司或其大股东蜂拥涉“银”,也在A股市场上掀起一波民营银行概念热,吸引资金竞相角逐,相关概念股近一个月来累计涨幅超过30%。  今年
期刊
随着IEEE802.11标准的发展,多个用户同时连接使用一个WiFi网络的场景随处可见。面向有线网络的TCP协议,在WiFi多用户环境下性能表现不佳,如何提高WiFi多用户场景下TCP业务的服务质量,具有非常重要的研究意义。
  本文首先针对WiFi多用户TCP业务QoS优化的问题进行分析,分析得出WiFi环境下的边缘用户MAC层确认易丢失导致下行数据不必要的重传,浪费大量空口信道资源,边缘用户自身TCP业务QoS会因此下降。本文利用IEEE802.11标准MAC层块确认机制和TCP协议可靠传输机制
对视频中的动作进行定位是理解视频内容的一个重要手段,然而,视频中的动作往往有着丰富的语义内容和复杂的背景知识,使得这些动作并不能完全被归纳到一个预定义的动作集中。为了解决这个问题,基于自然语言的视频段定位(Query-based Moment Retrieval in Videos,QMRV)被提出,QMRV主要研究的是:给定一段自然语言描述作为检索语句,我们要从一段未剪辑的长视频中定位出与该描述相对应的视频片段,即确定该视频段的起止点。作为一个新出现的领域,QMRV任务由于其在视频理解和人机交互方面的广