论文部分内容阅读
无处不在的轨迹数据,例如手写文字、笔迹签名、手势动作、人体运动或车流运动等,都与人类生活工作和人身财产安全有着密不可分关系。随着智能设备中各种传感器的普及,丰富的轨迹数据得以采集,促进了轨迹数据挖掘和分析的研究。作为轨迹数据挖掘中重要一环,轨迹识别通过机器学习方法实现轨迹的自动辨别,赋予原始数据更高的价值。本文以单运动点的手写轨迹和多运动点的人体骨架运动轨迹为研究对象,结合粗糙路径理论中的路径重积分特征与机器学习领域的深度学习方法两大研究工具,探究更加鲁棒、高效、有效的轨迹表征和识别方法。目前轨迹识别的难点是:轨迹数据丰富多样,可能呈现规模或大或小、类别多、标签错误等复杂现象,增加了机器学习模型训练和识别的难度;轨迹表征需要兼顾轨迹局部、区域和全局信息,以实现更加完整的轨迹信息提取;多运动点轨迹识别则需要结合轨迹数据不同维度的信息,更好地提炼轨迹的空间结构和时间动态特性。为了解决上述轨迹识别的难点,本文的研究工作和成果如下:(1)针对轨迹数据的复杂情况,我们从数据增强、高效训练和数据增广三个方面都提出了不同的、新颖的解决方案。对于手写文字轨迹,我们设计领域知识增强层,通过多样的传统手写领域技术对原始数据提取丰富的先验知识,促进深度模型性能提升。对于大规模大类别的手写识别,我们借鉴心理学Leither学习盒子的思想,提出取舍样本的深度模型训练方法,不再使用传统的均匀抽样,而是依据深度模型在迭代训练中的输出置信度来衡量每个样本下次迭代被抽取的概率,从而自动地、动态地筛选出难识别样本进行反复学习,进而还可以过滤掉错误标签的样本以防噪声干扰,最终实现基于深度模型的高效训练,在手写识别任务中取得当时最佳识别结果。对于少样本的手写笔迹轨迹,我们提出舍笔段法,通过轨迹切分后随机舍弃一定比例的轨迹段,实现数据增广的需求;又由于舍笔段法能够破坏文字的轨迹结构,使书写者识别系统能够更好应对文本内容随意变更的情形。(2)由于轨迹表征需要兼顾局部和全局信息,我们提出基于路径重积分特征的解决方案。我们从机器学习应用角度对路径重积分特征进行详细解释和分析,探讨了它作为轨迹表征的适用性。在实际应用中,对于任意旋转角度的文字的识别,我们提出层级路径重积分特征,将原始轨迹切分成层级的小段轨迹,使得重积分特征能够高效提取从局部到全局的不同范围的信息。对于书写者笔迹轨迹,为了区分它们之间细微又隐秘的差异,我们提取高阶的路径重积分,着重描述局部细节的几何依赖关系,从而实现书写者识别的突破性进展。(3)面对高维的多个运动点的轨迹识别,我们提出一套时空间的路径重积分特征的提取方法。在人体骨架动作识别中,我们使用任意两个或三个骨架点组合后的路径重积分特征描述骨架在空间中的结构约束,再将时间上不断演变的空间特征作为路径,提取时间轴上路径重积分特征来表示骨架点移动的时间动态信息,最后结合时空间的特征,我们在四个典型的人体动作数据集上都取得了当时最佳的识别率。