基于激光雷达的人体行为识别技术研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:jiajia0321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别在人工智能领域有着广泛的应用,并逐渐应用于日常生活中。本文使用激光雷达作为行为识别的硬件设备,采集人体行为的点云图像。本文将人体行为分为姿态和动作两个大的类别,分别采集数据进行行为识别。虽然卷积神经网络存在训练时间久、硬件开销大等缺点,但其性能优越,广泛应用于语音识别、图像识别、目标检测等各个领域。本文通过对国内外关于行为识别技术的分析和研究,使用卷积神经网络,实现基于激光雷达的人体行为识别。本文主要工作如下:针对激光雷达人体姿态识别中,卷积神经网络模型复杂度高、训练开销大的问题,本文提出了一种基于改进Efficient Net的人体姿态识别模型。首先对该模型进行简单概述,其次对Efficient Net模型架构进行分析,从整体结构和激活函数两个方面对Efficient Net进行改进,提高模型识别效率。本文所用数据集相比于Image Net数据集在规模上小很多,使用小规模数据集对神经网络进行训练时,Efficient Net模型过于复杂;通过大量实验,在模型准确率未下降的前提下,减少该模型中主要模块的数量,从深度上对Efficient Net进行精简。Efficient Net调整后,网络层数减少,Swish激活函数不再具有优势;本文使用Leaky Re LU激活函数取代Swish激活函数,实验证明,Leaky Re LU激活函数在深度较浅的网络中效果更优。针对激光雷达人体动作识别中,3000ms点云图空洞和噪声过多、人体动作特征难以提取的问题,本文首先通过形态学闭运算,选择合适的结构元,对点云图中的大面积空洞进行填充;其次使用迭代引导滤波算法,去除点云图中的噪声和非必要的小结构,保留人体动作边缘特征的同时,去除图像中无关的冗余信息;接着使用Canny边缘检测算法手动提取人体动作的边缘特征信息,空洞和噪声的去除为边缘检测提供了条件,否则大量空洞和噪声都会被误认为边缘信息,影响特征提取的效率;最后将手动特征提取与深度学习中的自动特征提取相结合,使用处理过的单通道图像对改进的Efficienct Net进行训练,有效的提高了动作识别的准确率,并节约一定的训练时间。在姿态和动作识别方法的基础上,设计和实现了一个基于激光雷达的人体行为识别原型系统,详细的描述了系统的框架和人体行为识别的具体流程,并且对系统不同模块的功能进行详细的分析和说明;最后,对人体行为识别系统的性能进行测试,并且通过简洁友好的可视化操作界面,对系统的识别结果进行直观的展示,证明本文人体行为识别模型和系统的可行性。
其他文献
热红外成像技术是判定物体热辐射能量的一种被动红外技术,因其能突破人类视觉局限,被广泛运用于城市安防监控等领域。然而,红外热辐射具有严重的反射现象,通常在含有光滑且发射率低的场景中,具有热辐射的行人或其他物体易产生红外热辐射伪影,干扰了红外图像的后续检测和识别处理。针对解决热辐射反射伪影造成的干扰和充分利用伪影信息,以及热成像目标检测算法需考虑实时性和移动嵌入平台的计算能力,本文研究目的是对红外图像
学位
化疗已被广泛应用于癌症的临床治疗,但其对身体正常组织伤害较大并且肿瘤会产生耐药性。光疗作为一种先进的癌症治疗方法,因其低细胞毒性、高时空选择性和无创性等优点受到了广泛关注,其中包括光热治疗(PTT)和光动力治疗(PDT)。此外,化学动力学治疗(CDT)因其不需要外部能量、细胞毒性小和响应肿瘤微环境等优点,常常与PTT、PDT等治疗方法协同作用,PTT产生的热量有助于增加瘤内血流量和氧合作用,从而促
学位
面对互联网上海量的文本信息,有效地进行信息检索时每个互联网用户的重要需求。而文本结构分析就是信息检索等一系列文本相关工作中的重要基础和关键步骤。针对目前对于流式文本文件的结构分析研究较少,且通常局限于一定规则或语言类型的问题,本文提出并实现了一种文本标题层次结构识别的方法,对以Word文档为主的流式文件识别文本的标题层次结构,通过对文本标题结构的识别来实现对文本结构的分析。经过实验发现,使用支持向
学位
随着科学技术进步与人类经济社会的发展,各类电子传感装置已被广泛应用,伴随着人民生活水平的提升,智能手机、智能手表等智能装置也将越来越流行。人类普遍携智能装备外出,旅行方式也越来越多样化,包括普通的走路、骑马、驾车,在都市中都搭乘公共汽车、轨道交通,长距离旅行时搭乘列车、航空客机等交通工具。此时,各种传感装置采集到海量的轨迹信息,通过挖掘这些轨迹信息,能够获取很多有价值的资讯,并可广泛地用其服务于活
学位
数字经济的发展促进了数据要素在不同市场及市场中各个主体间的流动分配,数字化转型为企业与外部提供了信息沟通渠道,增强了企业数字治理能力。通过选取A股上市公司2014—2020年面板数据为研究样本,从微观主体和宏观区域双视角探寻数字化转型能否缓解市场价值对内在价值的偏离程度。研究结果表明,企业数字化转型能显著降低股票市场价值对内在价值的偏离程度,在数字经济发展水平越高的地区,这种影响作用越显著;进一步
期刊
由于面部表情是人类传递情感和状态的重要形式,表情识别已成为人工智能领域不可或缺的一部分,也是计算机视觉最热门的研究领域之一。随着深度学习的浪潮爆发以来,计算机视觉和机器人技术取得了长足的进步,但是表情识别领域的难题仍然亟待解决。近年来,一系列表情数据库的建立,为基于深度学习的表情识别提供了源动力,推动了这个领域的飞速发展。表情识别数据库可分为两个大类,一个是实验室环境的表情数据库,一个是真实环境的
学位
电致化学发光(ECL)生物传感方法是一种基于生物分子识别引起ECL信号响应实现检测的方法,其中以生物活性分子作为识别元素,以ECL试剂/材料作为信号指示,通过将生化相互作用转化为可量化的ECL信号来测量目标分子的浓度。它结合了电化学方法和化学发光方法的优点,与其他光学分析法相比,具有高灵敏度、高选择性、低背景信号、宽的动态检测范围、设备简单等诸多独特的优势。在ECL生物传感器中,比率型ECL生物传
学位
自旋交叉(SCO)现象广泛存在于3d~4-3d~7过渡金属配合物,是一个很有潜力的研究领域,应用范围包括超高密度存储器件、传感器、分子电子学和自旋电子学等。但这些应用要求配合物表现出接近室温、磁行为突变且存在较宽磁滞的自旋交叉行为,而大部分已报导MnⅢ配合物都处于高自旋态(HS)。本论文旨在通过改变配体、阴离子等来调节MnⅢ配合物的结构和性质,以获得目标产物,为SCO体系的发展做出了重要贡献,研究
学位
当前,有机-无机杂化钙钛矿太阳能电池的实验室光电转换效率(PCE)已经达到了25.7%,但是铅(Pb)的毒性制约了Pb基钙钛矿的商业化发展,因此发展无铅钙钛矿太阳能电池显得十分重要。在Pb元素的众多替代元素中,锡(Sn)元素与Pb元素大小和性质相近,并且制备出来的Sn基钙钛矿和Pb基钙钛矿具有相似的光学及电学性质。除此之外,Sn基钙钛矿的光学带隙更小,电子传输能力更强,这也就意味着Sn基钙钛矿太阳
学位
随着工业制造和计算机辅助技术的不断发展、工业产品造型复杂度不断提高,传统的二维图像测量系统提取的信息已经不能够满足工业生产、制造和检测需求。同时,整个工业制造系统也朝着智能化、自动化的方向不断进步,这也对测量技术提出了更高要求。线结构光三维测量技术是一种非接触式的高效、灵活、精度稳定的测量手段,被广泛地应用于工业生产中零部件表面轮廓的测量。本文以线结构光三维测量技术为基础,根据需求分析,设计了符合
学位