论文部分内容阅读
随着硬件技术的发展,普通的智能手机已经能够进行复杂的图像处理任务,由此推动了移动可视定位技术的产生和发展。当前移动可视定位研究主要采用客户端-服务器模式,利用视觉特征实现图像目标识别,而这种模式势必会产生网络延迟、客户端存储容量受限、客户端计算能力有限和对城市级数据库视觉特征分辨性不足等问题。针对现存城市级图像数据库普遍缺少地理信息标注的问题,构建了武汉城市街景图像数据库,包含了129.5万幅图像数据,每幅图像都记录了相关的地理坐标和方向信息,用GPS进行分区。针对移动可视定位中检索数据量大的问题,使用移动设备自带的传感器对检索范围进行筛选。选定GPS距离小于200米,方向差60度范围内的数据库图像进行检索,排除了大量非相关图像,既减小了检索数据量,又提高了检索准确率。针对图像检索中视觉特征计算复杂的问题,使用提取速度快的竖直SURF特征生成两种图像描述符,分别进行二值化,对多特征进行融合提高图像检索的分辨力,选择融合后图像描述符的128个维度描述每个GPS分区视觉特征,使用GPS、方向和选择的视觉特征共同建立索引文件。实验结果表明,引入传感器可以减小检索数据量,缩短检索时间;使用二值化、视觉特征融合和选择维度的方法可以对图像编码进行压缩,加速图像相似度计算,同时保证移动可视定位结果的正确率;使用基于传感器和视觉融合建立的索引文件可以节省手机的存储空间和运算时间,直接在移动设备上完成可视定位。