论文部分内容阅读
人体行为识别(Human Activity Recognition,HAR)是普适计算领域中的一个典型应用,为很多上层应用如医疗、军事、娱乐等提供了重要的基础信息。随着微机电技术的发展,智能传感器模块在感知能力和识别精度方面得到显著提升,以加速度计为主的传感模块在HAR领域得到了更广泛的应用。因此,目前很多研究工作都在利用传感器提取人体时空运动信息,例如加速度、角速度等行为数据来实现行为识别。类似于其它模式识别系统,基于时空运动信息的HAR系统也遵循通用的识别流程,包括设备部署与数据准备阶段,模型训练阶段和行为识别阶段。识别流程的每个阶段所存在的问题都会对HAR系统的最终识别性能有不同程度的影响,例如:(1)在设备部署与数据准备阶段,传感设备会因为用户误操作或运动剧烈等原因而发生偏移,使设备的位置与朝向发生变化,进而导致所采集的运动信息出现失真,并影响最终的识别准确率。目前已有的研究着重于通过空间坐标转换消除设备偏移的影响,但这种方式需要较多的先验信息,也不符合实际运动场景下随机的偏移情况。(2)使用深度学习模型作为分类器时,其在训练阶段往往需要大量的数据来保证深度学习模型的识别精度,然而数据采集需要大量消耗人力和时间,当公共数据集规模较小时,则不能确保其足以充分训练模型。因此如何自动化地生成训练数据以充分训练深度学习模型是对行为识别领域的一大挑战。较为常用的数据扩充方法或代价较大难以实现,或与原数据较为相似而对模型训练价值较小,需要一种新的方法来进行自动化的行为数据生成。(3)在行为识别阶段中,不同行为之间往往存在过渡性质的行为,如果不对这一类过渡行为进行适当处理,则会影响识别系统对于基本人体行为的识别准确率。因此过渡行为的识别是行为识别阶段必须要考虑的一个问题。目前对于过渡行为的识别所构建的模型较为复杂,从行为数据本身的趋势特性来判断行为的状态更为直接简单。(4)基于时空运动信息的HAR系统多使用移动便携设备,其本身的电量都较为有限,系统生命周期受电池电量的限制。如何在保证一定识别准确率的情况下尽量减少设备能耗,延长整个系统的使用周期对于低功耗的普适计算场景是需要解决的一个问题。目前的行为识别的节能化策略多样化,涉及系统多个层面,多数相关研究集中于对一种节能策略在系统中发挥的作用进行探讨,缺乏对于多节能策略综合效果的研究。以上这些问题都会对HAR系统的识别性能造成影响,因此对这些问题进行研究,对于提升HAR系统对各类行为的识别准确率是十分必要的。本文以HAR系统的通用识别流程为主线,从识别流程的各关键阶段的视角出发,基于各类传感设备/单元所提供的的包括加速度、角速度、地磁值等时空运动信息,以提升对人体行为的识别准确率为目的,研究基于时空运动信息的HAR系统的行为识别方法。本文主要工作内容如下:1、针对设备偏移导致的数据失真问题,本文提出了一种基于卷积神经网络与支持向量机相结合的识别模型。由于卷积神经网络在图像识别领域对图像的噪声、翻转等具有一定的鲁棒性,所提出的模型拟利用该特性来处理数据失真问题。该模型的核心思想是利用卷积网络对数据失真所具有的鲁棒性来改善失真数据对识别准确率的负面影响。模型首先使用卷积神经网络对失真数据进行处理,得到隐藏特征向量,然后使用支持向量机基于特征向量进行训练与识别。在实验部分首先通过仿真实验结果说明了由于设备偏移导致时空运动信息的失真所带来的影响,同时也测试了支持向量机算法的本身性能。然后基于失真数据集对所提出的识别模型进行测试,结果显示所提出的模型在失真的公共数据集上可以产生约15%以上的准确率提升,而在失真的自采集的真实数据集上也有约10%-20%的准确率提升。2、针对训练深度学习模型时进行训练数据自动生成问题,本文基于经典的深度卷积生成对抗网络(Deep convolution generative adversarial network,DCGAN)结构设计了一个可以生成训练数据的生成对抗网络HARAug-GAN。由于在数据生成方法中,GAN类型的生成模型既可以自动化数据生成,所生成数据又具有不同于真实数据的细节,本文拟选择经典GAN模型——DCGAN来进行数据生成。DCGAN通过零和博弈手段可以生成与原始数据具有一定相似度的拟真数据。而HARAug-GAN模型正是利用DCGAN的这一特性,来自动化生成大量拟真数据以充分训练深度学习模型。HARAug-GAN生成的拟真数据与真实数据以一定比例混合之后对深度学习模型进行训练。实验结果表明,生成的拟真数据与真实数据在以一定比例混合后,模型的整体识别准确率可达87.88%,对某些类别的活动的识别准确率有明显提升。此外,从实验结果来看,生成数据可以提升数据集的丰富程度,并对真实数据有补充和替代作用。通过HARAug-GAN自动生成训练数据既可以保证模型的识别精度,也可以大大降低数据获取的代价。3、针对过渡行为识别问题,本文提出了一个基于标准差的趋势分析算法STD-TA对含有过渡行为的行为集合进行识别。不同于基本类行为,过渡行为通常持续时间短暂且伴有强烈变化,而这种变化会很显著的反映在行为数据变化上,因此本文所提出的算法选择对行为数据的变化趋势进行观察进而识别过渡行为。算法的核心思想是通过支持向量机识别目标行为,通过输出的概率结果,结合当前窗口的加速度计数据的标准差趋势来判断是否属于过渡行为。实验部分首先确定了模型中的关键参数,然后利用含有过渡行为的真实数据进行测试,结果表明所提出的算法可以有效的判别出数据中的过渡行为部分,提升系统对基本行为集合的整体识别准确率。4、针对使用移动设备进行行为识别的场景,本文提出了一个低功耗行为识别方法EF-CNN。由于目前行为识别所使用节能策略多以单一策略分析为主,缺乏对多策略综合作用和相互影响的分析,因此所提出的识别模型使用了基于混合节能策略行为识别方法。此方法主要包括两个节能策略,其一为预分类策略,其核心思想是基于中心特征对易识别的行为进行预分类,降低主分类算法的调用频率,缩短行为分类所需的时间;其二为自适应采样频率控制策略,其核心思想是通过对目标过往历史行为的分析,自适应地控制传感器的采样频率,通过在适当时机降低其采样频率从而降低设备能耗,延长其使用周期。从实验结果来看,EF-CNN相比同类工作成果而言,在保持同等识别准确率的基础上,可以显著降低设备能耗,具有更好的节能效果。总而言之,本文对HAR系统的识别流程中的四个关键问题进行研究,并提出了相应的解决方案。实验结果表明,提出的方法从不同方面改善了系统性能,提高了HAR系统对人体日常行为的识别准确率。