低照度下人体姿态估计及行为识别研究

来源 :中国科学院大学(中国科学院沈阳计算技术研究所 | 被引量 : 0次 | 上传用户:mzl521fnn1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为的识别一直是人工智能领域比较热门的研究方向。已经被广泛应用在智能家居、虚拟现实、智能安防、视频监控等领域。但是在低照度情况下,尤其是在一些乡村的夜晚及比较暗的环境下,更容易发生犯罪等危险行为,在这样的环境下监控摄像头无法捕捉到清晰的画面,行为识别算法无法发挥其应有的作用。无人驾驶过程中需要识别出各种环境及天气下的行人行为及其趋势,在低照度下,无法捕捉到清晰的画面,从而无法达到安全驾驶的目的。目前的人体行为识别算法都是针对可见光图像的。多光谱成像技术不但能提供RGB图像,还提供有价值的远红外图像,其成像的物理特性能够让其实现全天候,低干扰的检测,在国防监控以及车辆辅助驾驶领域都有着广阔的发展前景。为了解决以上问题,本文首先利用多光谱设备提供的多模态数据对RGB图像和远红外图像中的行人进行检测。由于基于骨架的行为识别的每个子任务都是基于卷积神经网络的,所以我们对卷积神经网络的剪枝算法进行研究。之后在第一步得到的行人检测框内对人体关键点进行检测。最后利用人体关键点形成的骨架序列对人的行为进行识别。本论文开展的主要研究内容如下:1.基于Transformer特征融合及直方图层的行人检测网络研究。针对白天和夜间图像的特点提出两个网络FTHd(Day Network of Fusion Transformer and Histogram Layer)和FTn(Night Network of Fusion Transformer)。白天RGB图像纹理特征比较明显,我们首先将直方图层加在检测网络的输入分支中,之后再将不同感受野的特征进行Concat操作。最后我们在网络前端加入跨模态特征融合方法CFT模块对特征进行融合与交互。利用Transformer的自我关注机制,网络能鲁棒捕获RGB特征和远红外特征的潜在相互作用。夜间光照很弱,远红外图像起到关键的作用,但是远红外图像的纹理信息较弱,通过VGG网络已经可以非常充分的得到两流的特征,所以我们将VGG Conv4-3层卷积后的两流特征合并成一个流,这样不但能提高夜间数据集检测的准确率,还能大大的减少网络的参数量。最后,我们在VGG网络前端加入CFT模块进行特征融合,同时进行模内和模间融合。2.卷积神经网络通用化剪枝算法研究。行为识别的每个子任务都是基于卷积神经网络的,所以我们提出了针对卷积神经网络的通用化剪枝算法。首先对网络的所有特征层,采用特征反卷积可视化为指导的方法对网络特征进行剪枝,计算每一层网络的每一个特征图的贡献率及每一对特征图之间的相似度,对贡献率低及相似度大的特征图进行剪枝。剪枝后对网络参数进行Fine tuning,经过不断的剪枝循环迭代,生成最终精减后的模型。剪枝优化后的模型在速度提高的基础上,精度也有一定程度的提升。本文提出的特征反卷积的剪枝方法是通用的剪枝方法,可以应用于其他类似的网络剪枝任务中,不受网络输入图像类型及网络结构的限制。3.远红外人体关键点检测研究。低照度情况下的人体关键点检测是这部分需要解决的主要问题。本文创新性的利用远红外图像提取人体关键点,提出一种新的注意力导向的两阶段轻量级卷积神经网络LMANet。该网络包含两个阶段,第一阶段采用轻量级的深度可分离残差模块捕捉关键点的局部细节,而无需复杂的多个卷积层去捕捉图像的细节。第二阶段扩大图像的感受野,通过关键点之间的上下文关系来估计识别不好的关键点。由于远红外人体关键点检测没有公开的数据集,我们在公开的远红外行人检测数据集中挑选700张图像,进行人体关键点标注,并公开供其他研究者使用。4.利用远红外图像提取的人体关键点序列对人体的行为进行识别。主要工作分两部分:(1)首先将Conv-Shift-Conv(CSC)模块引入到网络结构中。之后针对CSC模块提出用更加稀疏的shift模块替换Shift-GCN中的shift模块,将其命名为Sparse Shift-GCN。提出网络减少了特征的冗余,防止了过拟合,提升了模型的泛化能力。最后,将OHEM Loss引入到提出的模型中。提出的模型在4个不同流上的精度均有不同程度的提升,提高了网络的整体性能。(2)在Sparse Shift-GCN基础上,提出将网络每层的输入输出个数设置成关节点的整数倍,即整数倍稀疏网络Int Sparse-GCN。接下来,我们对Shift-GCN中的mask掩膜函数进行研究和分析,发现mask掩膜函数80%以上的值都是不起作用的,针对以上问题设计了自动化遍历方法得到精度最高的优化参数。
其他文献
本文构建了非线性均值方程反映生猪产业链上游生猪价格、中游批发价格和下游零售价格间水平传导关系,并借助协整方程和中间商对来自外部冲击的响应分析了生猪产业链各主体的市场势力;建立零售价格波动函数和中间商价格波动函数,反映产业链上价格序列间的波动影响,并通过LSDV法估计了各主体所具有的市场势力对猪肉价格波动传导的非对称性冲击响应。同时,通过PVECM模型估计上游生猪价格、中游批发价格和下游零售价格偏离
<正>6月2日上午10点,太原市血液中心在万达广场举行万达新献血屋启用仪式。多年来,太原市血液中心在市政府、省、市卫健委的关心支持下,认真贯彻执行《中华人民共和国献血法》《山西省献血条例》《太原市献血条例》,以规范用血管理、保障省城临床用血为目标,夯基础、抓管理、强服务、提本领、拓业务、规程序,使我市无偿献血工作取得了长足的发展。太原市连续12届24年荣获"全国无偿献血先进城市"称号,2019年我
期刊
近年来,国家对环境保护越来越重视,城市污水处理规模和标准不断提升,使得城市污水处理厂的运行成本显著提升,对污水污处理厂的成本管理提出了更高的要求。文中结合具体工程案例,对其运行成本的管理方向和改进策略进行了探究总结。
以水性树脂为成膜物质,锌粉作为防锈颜料,通过配方设计,研制了双组分水性冷喷锌涂料。重点分析了水性树脂类型、防沉剂类型及用量、缓蚀剂类型及用量对水性冷喷锌涂料性能的影响。结果表明,采用水性聚氨酯分散体作为成膜树脂,添加占质量固体分0.3%的水性聚酰胺蜡作为防沉剂及占质量固体分0.2%的苯并三氮唑作为缓蚀剂,制备的水性冷喷锌涂料性能优异。
运用面板向量自回归模型,对长三角城市群利用外商直接投资与产业结构变迁的互动效应进行实证分析。研究结果表明:外商直接投资没有对长三角城市群产业结构合理化产生显著影响,其对长三角城市群产业结构高级化具有负向影响;长三角城市群产业结构合理化对利用外商直接投资具有负向影响,其产业结构高级化对利用外商直接投资没有产生显著影响。为了促进外商直接投资与产业结构的良性互动发展,长三角城市群应构筑利用外商直接投资的
目前用于建立和操作多媒体信息技术已经发展到了可确保高度真实感的程度.深度伪造作为一种生成式深度学习算法,可实现音频、图像、视频的伪造生成,近些年也取得了相当巨大的进步,与之对抗的深度伪造检测技术也在不断的发展中.梳理常见深度伪造生成的技术以及相关的数据集,总结其中的原理以及最新方法成果;并对深度伪造检测相关技术和数据集进行分析总结.最后,对深度伪造生成和检测的未来研究方向进行了总结和展望.
在新时期职高美术教学中,色彩教学在学生的学习目的、专业学习和学生素养等方面还有一定的不足,鉴于此,应该在明确职高美术色彩教学目标的基础上,实现教学理论与实践的有效结合,从而为职高美术更好地开展个性化教学提供更多建议。
通过对“7·20”河南特大暴雨事件相关谣言进行统计、梳理和分析,发现谣言具有总体数量多,内容涉及面广,传播形式升级等特征。在谣言传播机制方面,社交媒体成为主要传播平台,圈层传播成为重要传播模式,恐惧情绪成为传播直接动因。提出谣言治理的几点建议:建立谣言预警机制,变“被动”为“主动”;积极设置辟谣议程,搭建联合辟谣平台;加强谣言治理普法宣传,提高造谣法律惩戒力度。
文章基于符号互动理论,对乡村振兴背景下我国竹文化的产业化发展进行研究。分析了我国竹文化产业化发展面临的问题,对基于符号互动理论的我国竹文化产业化发展的情感化原则、主题性原则以及互动性原则进行了总结并提出了具体的竹文化产业化发展方法,包括强化宣传、寻求政府借力以及深度挖掘竹文化产业内涵等。
本文基于古代遗存的图像、文献资料,采用图像学与艺术学方法,对明代竹制坐具进行品类、工艺研究;将明代遗存的各类绘画、古籍画等图像资料进行搜集梳理,整理归纳明代竹坐具形象9种,共48件,以此为基础研究明代竹坐具总体情况,建构其品类体系,将其分为3大类及9种小类;同时从中选取代表性竹坐具案例开展考证分析,指出明代典型竹坐具的源流及形制特点,进一步提供分类依据;最后从竹坐具材料与工艺方面进行总结,提出明代