论文部分内容阅读
目前,移动可视搜索研究主要是基于客户端-服务器模式,将图像特征上传到远程服务器进行查询,从而完成目标识别。但这种模式对网络实时传输依赖性较强,当网络拥塞时,会出现查询速度很慢甚至无法查询的问题。因此,本文设计并实现了基于单机模式的移动可视搜索系统。 针对传统视觉词汇树体积较大的问题,提出通过残差量化树构建视觉词索引,并利用残差量化进行编码的方法,大大节约了存储空间。针对生成的图像描述符占用空间较大,无法在手机上直接存储的问题,对Boosting算法进行改进,并给出了利用改进后算法实现图像描述符降维的方案。针对城市图像数据集规模较大,无法直接检索的问题,提出根据图像GPS进行分区,并建立倒排索引的方法,大大缩小了检索范围。 实验结果表明,改进后的词袋描述符生成方法,在保持词袋描述符生成速度和检索性能的同时,显著减少了生成词袋描述符所需存储空间,使其可以在移动设备上直接生成;改进后的降维算法,在保持检索准确率的同时,有效压缩了图像描述符,使其可以在手机设备上直接存储;倒排索引的建立,有效缩短了检索时间。