论文部分内容阅读
随着移动互联网、物联网等技术的发展,视频应用越来越广泛地出现在社会生活的各个领域。从城市中的监控摄像头到人们的智能手机,甚至无人机、Google Glass等传感器,每天都在产生海量的视频。如何在这些视频中准确、快速地查询到感兴趣的视频越来越成为一个挑战。为了应对这个挑战,人们先后使用了文本标注和视频内容分析等方式对视频进行组织和检索,以期将非结构化的视频结构化,进而满足人们的检索需求。然而,由于各应用中视频数量巨大,内容复杂,使得这两种方式分别遭遇了来自人工层面和技术层面的限制。文本标注的方式简便易行,但人工的工作量大,且受工作人员的主观性影响。视频内容分析的方式受制于图像和视频的分析技术的发展,其分析结果与人类所能理解的形式存在着巨大的“语义鸿沟”。因此,亟需一种语义描述准确,且易于自动获取的视频元数据对视频进行组织,使得人们可以更加准确、快速地获取所需查询的结果。时空数据是一种理想的视频元数据。除去由人们后期制作的视频,大多数视频内容与其拍摄所在的时空密切相关,而人们对视频的查询语言中,时空条件的出现频率非常高。这构成了时空数据成为组织视频的一种理想元数据的必要性。随着传感器技术的发展,GPS、WiFi定位等位置传感器,电子罗盘、陀螺仪等姿态传感器以及电子时钟已经与视频传感器广泛集成,实时获取视频传感器的位置信息和姿态信息的技术已经成熟,这构成了时空数据成为组织视频的一种理想元数据的可能性。这两个条件的具备使得利用时空数据对视频进行组织和检索逐渐成为当前的研究热点。基于以上的背景和意义,本文定位于视频的时空检索方法研究,致力于回答“什么是更好的视频时空检索结果集合,怎样构建更好的视频时空检索集合”这两个问题,研究了视频时空特性、评价方法、检索方法和应用。本文的研究内容和成果如下:1)全景感知度。本文结合视频传感器覆盖和网络优化的相关理论,提出了一种以视频集合整体感知情况的评价机制——全景感知度。研究全景感知度及其所代表的最优视频集的概念和特性,从感知对象、感知作用、感知源三个方面综合分析建模,设计全景感知度及其所代表的最优视频集求解算法。2)基于全景感知度的视频时空检索。以全景感知度评价机制为依托,本文结合时空模型和索引相关研究成果提出了基于HR树的视频时空索引,并基于此设计了其时空检索方法。3)基于全景感知度的视频时空检索应用。研究基于全景感知度的索引和视频时空检索方法的搜索引擎实现,然后以搜索引擎所发布的服务为基础,以安防领域和社交网络领域为例,分析这两个领域中视频时空检索的应用需求,然后针对这些需求设计相应的应用模式,满足相关行业需求。