论文部分内容阅读
针对现有增强现实技术中应用较为广泛的基于标识物的定位注册方法的不足,提出了一种在不断变化运动的复杂动态场景下估计相机连续运动的3维姿态的方法。基于深度神经网络对输入图像序列建立端到端的学习模型,将卷积神经网络(CNN)作为高层特征提取器,同时利用长短期记忆神经网络(LSTM)建立视频连续帧之间的时序关系,完成相机连续运动的3维姿态估计,从而避免了相机快速运动及场景不断运动变换导致图像特征提取效果不好的情况。另一方面,通过迁移学习的方法来预测未知视频序列的相机3维姿态信息,解决了原始数据量不够的问题。