基于时空运动信息的日常人体行为识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:t_bear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别(Human Activity Recognition,HAR)是普适计算领域中的一个典型应用,为很多上层应用如医疗、军事、娱乐等提供了重要的基础信息。随着微机电技术的发展,智能传感器模块在感知能力和识别精度方面得到显著提升,以加速度计为主的传感模块在HAR领域得到了更广泛的应用。因此,目前很多研究工作都在利用传感器提取人体时空运动信息,例如加速度、角速度等行为数据来实现行为识别。类似于其它模式识别系统,基于时空运动信息的HAR系统也遵循通用的识别流程,包括设备部署与数据准备阶段,模型训练阶段和行为识别阶段。识别流程的每个阶段所存在的问题都会对HAR系统的最终识别性能有不同程度的影响,例如:(1)在设备部署与数据准备阶段,传感设备会因为用户误操作或运动剧烈等原因而发生偏移,使设备的位置与朝向发生变化,进而导致所采集的运动信息出现失真,并影响最终的识别准确率。目前已有的研究着重于通过空间坐标转换消除设备偏移的影响,但这种方式需要较多的先验信息,也不符合实际运动场景下随机的偏移情况。(2)使用深度学习模型作为分类器时,其在训练阶段往往需要大量的数据来保证深度学习模型的识别精度,然而数据采集需要大量消耗人力和时间,当公共数据集规模较小时,则不能确保其足以充分训练模型。因此如何自动化地生成训练数据以充分训练深度学习模型是对行为识别领域的一大挑战。较为常用的数据扩充方法或代价较大难以实现,或与原数据较为相似而对模型训练价值较小,需要一种新的方法来进行自动化的行为数据生成。(3)在行为识别阶段中,不同行为之间往往存在过渡性质的行为,如果不对这一类过渡行为进行适当处理,则会影响识别系统对于基本人体行为的识别准确率。因此过渡行为的识别是行为识别阶段必须要考虑的一个问题。目前对于过渡行为的识别所构建的模型较为复杂,从行为数据本身的趋势特性来判断行为的状态更为直接简单。(4)基于时空运动信息的HAR系统多使用移动便携设备,其本身的电量都较为有限,系统生命周期受电池电量的限制。如何在保证一定识别准确率的情况下尽量减少设备能耗,延长整个系统的使用周期对于低功耗的普适计算场景是需要解决的一个问题。目前的行为识别的节能化策略多样化,涉及系统多个层面,多数相关研究集中于对一种节能策略在系统中发挥的作用进行探讨,缺乏对于多节能策略综合效果的研究。以上这些问题都会对HAR系统的识别性能造成影响,因此对这些问题进行研究,对于提升HAR系统对各类行为的识别准确率是十分必要的。本文以HAR系统的通用识别流程为主线,从识别流程的各关键阶段的视角出发,基于各类传感设备/单元所提供的的包括加速度、角速度、地磁值等时空运动信息,以提升对人体行为的识别准确率为目的,研究基于时空运动信息的HAR系统的行为识别方法。本文主要工作内容如下:1、针对设备偏移导致的数据失真问题,本文提出了一种基于卷积神经网络与支持向量机相结合的识别模型。由于卷积神经网络在图像识别领域对图像的噪声、翻转等具有一定的鲁棒性,所提出的模型拟利用该特性来处理数据失真问题。该模型的核心思想是利用卷积网络对数据失真所具有的鲁棒性来改善失真数据对识别准确率的负面影响。模型首先使用卷积神经网络对失真数据进行处理,得到隐藏特征向量,然后使用支持向量机基于特征向量进行训练与识别。在实验部分首先通过仿真实验结果说明了由于设备偏移导致时空运动信息的失真所带来的影响,同时也测试了支持向量机算法的本身性能。然后基于失真数据集对所提出的识别模型进行测试,结果显示所提出的模型在失真的公共数据集上可以产生约15%以上的准确率提升,而在失真的自采集的真实数据集上也有约10%-20%的准确率提升。2、针对训练深度学习模型时进行训练数据自动生成问题,本文基于经典的深度卷积生成对抗网络(Deep convolution generative adversarial network,DCGAN)结构设计了一个可以生成训练数据的生成对抗网络HARAug-GAN。由于在数据生成方法中,GAN类型的生成模型既可以自动化数据生成,所生成数据又具有不同于真实数据的细节,本文拟选择经典GAN模型——DCGAN来进行数据生成。DCGAN通过零和博弈手段可以生成与原始数据具有一定相似度的拟真数据。而HARAug-GAN模型正是利用DCGAN的这一特性,来自动化生成大量拟真数据以充分训练深度学习模型。HARAug-GAN生成的拟真数据与真实数据以一定比例混合之后对深度学习模型进行训练。实验结果表明,生成的拟真数据与真实数据在以一定比例混合后,模型的整体识别准确率可达87.88%,对某些类别的活动的识别准确率有明显提升。此外,从实验结果来看,生成数据可以提升数据集的丰富程度,并对真实数据有补充和替代作用。通过HARAug-GAN自动生成训练数据既可以保证模型的识别精度,也可以大大降低数据获取的代价。3、针对过渡行为识别问题,本文提出了一个基于标准差的趋势分析算法STD-TA对含有过渡行为的行为集合进行识别。不同于基本类行为,过渡行为通常持续时间短暂且伴有强烈变化,而这种变化会很显著的反映在行为数据变化上,因此本文所提出的算法选择对行为数据的变化趋势进行观察进而识别过渡行为。算法的核心思想是通过支持向量机识别目标行为,通过输出的概率结果,结合当前窗口的加速度计数据的标准差趋势来判断是否属于过渡行为。实验部分首先确定了模型中的关键参数,然后利用含有过渡行为的真实数据进行测试,结果表明所提出的算法可以有效的判别出数据中的过渡行为部分,提升系统对基本行为集合的整体识别准确率。4、针对使用移动设备进行行为识别的场景,本文提出了一个低功耗行为识别方法EF-CNN。由于目前行为识别所使用节能策略多以单一策略分析为主,缺乏对多策略综合作用和相互影响的分析,因此所提出的识别模型使用了基于混合节能策略行为识别方法。此方法主要包括两个节能策略,其一为预分类策略,其核心思想是基于中心特征对易识别的行为进行预分类,降低主分类算法的调用频率,缩短行为分类所需的时间;其二为自适应采样频率控制策略,其核心思想是通过对目标过往历史行为的分析,自适应地控制传感器的采样频率,通过在适当时机降低其采样频率从而降低设备能耗,延长其使用周期。从实验结果来看,EF-CNN相比同类工作成果而言,在保持同等识别准确率的基础上,可以显著降低设备能耗,具有更好的节能效果。总而言之,本文对HAR系统的识别流程中的四个关键问题进行研究,并提出了相应的解决方案。实验结果表明,提出的方法从不同方面改善了系统性能,提高了HAR系统对人体日常行为的识别准确率。
其他文献
光学自由曲面元件能够显著提高现代光学系统的设计自由度和成像质量,为现代光学系统的轻量化和精细化发展提供必要的技术支持,因此广泛应用于空间光学、增强现实等领域的光学系统当中。随着现代光学系统对自由曲面元件的需求与日俱增,智能制造领域对自由曲面元件加工效率的要求不断提高,对自由曲面元件的测量效率也提出了更高的要求。基于共焦传感原理的三坐标测量机和轮廓测量仪具有无损伤和高通用性的优势,成为了大口径自由曲
学位
智能电能表是智能电网中最重要的计量仪器之一,截至2020年底,中国的智能电能表安装总量已达5.4亿只,且数量仍在持续增加。海量的智能电能表对计量技术提出了规模化、高实时性、高准确度的需求,但现有的电能表计量技术已无法满足上述需求。近些年,随着智能电网信息采集系统的建立,基于大数据分析的在线计量技术为以上问题提供了一种解决思路。智能电能表在线计量的核心内容为电能表误差的在线估计,但现有的电能表误差在
学位
人口快速老龄化背景下,我国政府大力鼓励在城市推广社区养老服务,以满足大多数老年人的就地安老需求,因此城市社区综合养老服务设施(简称“综合养老服务设施”)的建设具有重要的社会意义。近年来,城市社区综合养老服务设施的建设在资源配置、人本接受和经济运营等方面都存在问题。对综合养老服务设施建设的研究需要跳脱单一的建筑领域,采用学科交叉的视野。“社会设计”作为一种设计学和社会学结合的设计理论和方法论,它致力
学位
共焦显微测量技术因其高灵敏的纵向层析能力和优于普通光学显微镜的横向分辨率,被广泛应用于材料表面结构测量、微系统与微器件加工质量把控等工业检测领域。共焦显微镜作为一种光学扫描成像系统,由光学系统和扫描系统共同导致的三维畸变是造成其测量精度损失的主要原因之一。因此,实现三维畸变校正是保障共焦显微测量系统对三维微尺度进行高精度检测的必要前提。传统畸变校正方法在实现工业共焦显微镜的三维畸变校正时,需要高精
学位
激光是20世纪的重大发明,对人类社会发展和生活进步产生了重要影响。小型化是激光发展的必然趋势,而光学衍射极限限制了激光器的小型化。表面等离激元是金属表面电子的纵向集体震荡,因能将电磁能量存储于电子震荡中而突破传统光学衍射极限。基于表面等离激元的激光器能够在光学模式尺寸和器件物理尺寸上均突破极限,是实现相干光源小型化的最有效方法。得益于表面等离激元的模式限制作用和场增强效应,等离激元激光器能够产生纳
学位
气化被誉为最有潜力的秸秆生物质利用方法,然而,焦油的存在却限制了该技术的发展。焦油不仅会堵塞输送管路,使得气化系统无法正常运行,还会影响产气的后续燃烧利用。产气中包含大量不可燃组分,其体积大、热值低,在燃烧利用时点火困难、燃烧稳定性差。通过提高气化温度的方法可将焦油进一步转化为不可凝的轻质气体,从根本上解决气化焦油问题,同时,不含焦油的高温产气也可直接加以燃烧利用,这不但避免了产气自身携带能量的损
学位
角度作为关键的基础几何量之一,实现其高精度测量对科研领域和工业应用具有重要意义。角度测量主要包含对绕坐标轴X轴、Y轴和Z轴旋转的俯仰角、偏摆角和旋转角的三维角度测量。在实际工程应用和科学研究中,许多领域需要对三维角度变化量进行同时测量。例如,坐标测量机的阿贝误差测量、卫星有效载荷姿态角测量、导弹发射位姿监测等都要求同时对三维角度进行高精度测量,测量精度通常要求在角秒甚至亚角秒量级。因此,亟需一种可
学位
量子密钥分发(Quantum Key Distribution,QKD)是利用量子力学基本原理为合法通信方分配安全密钥的技术,与一次一密加密算法相结合可提供无条件安全的保密通信服务。QKD分为离散变量QKD(Discrete-Variable QKD,DV-QKD)和连续变量QKD(Continuous-Variable QKD,CV-QKD)两大类,其中CV-QKD具有量子态制备探测简单高效,制
学位
星间时间基准同步、地球重力场测量等空间探索任务对脉冲激光光源的脉冲能量、体积大小等关键参数提出了更严苛的技术要求。现有的技术方案要对种子源脉冲激光进行一级或多级放大,这无疑增加了光源装置的复杂性、占据了更多的空间资源。为了直接提升种子源阶段输出的脉冲能量,相关学者们从复式金兹堡-朗道方程出发理论预言了高能量光学脉冲极峰孤子的存在。基于砷化铝镓波导阵列的快速可饱和吸收方法具有结构参数可被优化、损伤阈
学位
随着高通量测序和芯片技术的快速发展,基因组学的研究逐渐入了后基因组时代,包括DNA修饰、RNA编辑、组蛋白修饰及染色质结构重塑等表观遗传学逐步成为基因调控领域的研究热点。DNA甲基化作为最早发现的表观遗传机制,随着海量数据的积累,使得研究DNA甲基化与转录因子相互作用及基因调控功能成为可能。DNA甲基化与转录因子相互作用的生物功能对理解DNA甲基化与特定遗传疾病、发现新的疾病标志物和新的药物靶点等
学位