论文部分内容阅读
普适计算是继主机计算模式、桌面计算模式之后发展起来的新的计算模式,其本质特征是实现物理空间与信息空间的融合和计算对人透明,普适计算中信息空间和物理空间的融合可以在不同尺度上得到体现,其在房间、建筑物这个尺度上的体现就是智能空间,智能空间是一个融入了计算、信息设备与多模态的物理空间,使人们可以在工作、生活的现场透明地获取计算和信息服务,是普适计算的一种具体而集中的体现,是实现普适计算的重要途径。上下文感知是实现智能空间的基础,是普适计算和智能空间中一个核心的研究课题。位置信息作为上下文中最广泛利用的信息受到了普遍关注,现在已有许多不同的位置感知系统出现。视觉定位是位置感知的一种方式,由于其容易实施、价格便宜、目标物体不需要携带附属物的优点而受到普遍关注,目前二维视频定位已取得不少成果,但不适用于智能空间环境,研究向三维视频定位发展。
本文的目的是在智能空间环境下使用视频对物体进行定位,需要首先进行摄像机定标,我们采用张正友定标算法,该方法首先根据摄像机小孔模型得到摄像机模型的参数初始值,然后非线性化求得最优值。该方法只需要在不同的角度和位置通过模板动作或摄像机动作来拍摄几幅图片即可完成标定。当两个摄像头的相对状态被改变时,只需要再分别在左右摄像头给模板拍摄一幅图片,即可重新标定。非常简单方便。
本文使用两个摄像头对物体进行定位,需要在两个图像空间搜索到物体的对应点,然后三维重建得到物体的空间坐标,如果在图像全局空间搜索目标,跟踪效率会很低,若根据物体的当前运动状态预测物体的下一步运动状态,会减少搜索的时间,提高跟踪的效率。
本文采用序列蒙特卡洛方法也称粒子滤波器方法广泛应用于非线性非高斯系统中,对于物体运动这一非线性非高斯系统,可以使用粒子滤波器来预测物体下一帧运动状态,提高搜索效率。重要密度函数是设计粒子滤波算法的关键,本算法的核心思想是在x,y和z方向分别使用粒子滤波器预测物体在x(y或z)方向上的位置、速度、加速度,得到粒子位置的期望和标准差,通过摄像机标定返回图片上预计会出现的区域,在该区域中搜索目标,会加快搜索的速度。然后根据搜索到粒子在两个图片中的位置,算出其在物理空间中的位置,据此更新每个粒子的权重。其中着重解决初始化问题、重要密度函数等问题。
粒子滤波算法的优点是只须给出模型的状态方程和观测方程和重要密度函数,就可以在这个框架下得到解决,因此实现特别简单。
本文的贡献在于提出一个基于粒子滤波器的视频定位模型,未来可使用在智能空间环境中。使用粒子滤波进行视频定位,在国内尚是一个较新的研究领域,还有大量的工作要做。就本文涉及的范围来说,进一步的工作包括粒子滤波算法的改进、多目标跟踪算法、多通道的融合、人机交互、构建上下文感知应用等。