论文部分内容阅读
监控视频作为一种能够表达地理场景实时变化,展现人与地理场景交互情况的动态数据,已得到越来越广泛的关注。视频数据拥有数据量巨大、运动目标信息稀疏分布两方面的特性。这种情况与有限的人工视频检索分析能力构成了巨大的矛盾,制约着人对视频信息的快速理解与有效使用,需要更为自动、智能的视频处理方式辅助用户高效浏览分析视频信息。为了从庞大繁杂的监控视频中提取高价值的信息供用户快速浏览分析,研究者们提出了监控视频浓缩方法(以下简称“视频浓缩”)。视频浓缩通过从原始视频中提取运动目标信息(通常为行人、车辆),在较短的时间段内集中表达,便于用户高效理解视频内容。然而,目前视频浓缩方法的时空融合分析与高效表达能力有待进一步提升,特别是视频浓缩过程中对于地理场景空间信息的顾及能力需要增强,亟待发展一种集地理环境与视频分析于一体、基于高效准确数据提取与分析功能的视频浓缩方法。鉴于此,本文以视频数据与GIS数据的协同分析为手段,拟探索基于视频场景空间化与轨迹聚类的视频浓缩理论,发展地理场景中监控视频浓缩方法,本文的研究内容与主要成果如下:(1)提出地理场景中视频运动目标轨迹聚类建模方法。为提升视频浓缩表达效率,需要进行视频运动目标轨迹聚类建模处理。现有轨迹聚类结果的地理空间适应性不佳,轨迹类建模结果无法表达地理空间信息。针对上述问题,本文提出了地理场景中视频运动目标轨迹聚类建模方法。该方法基于视频场景空间化结果,通过对轨迹在相机视域范围内的出、入口分别进行QT聚类并组合聚类结果,实现地理场景中视频运动目标轨迹聚类。通过对轨迹类进行边界线提取与拟合处理,实现轨迹类建模。实验结果表明,相较于图像空间轨迹聚类建模结果,本文方法获得的聚类结果具有更好的地理空间适应性;建模结果能有效地表达迹类的地理空间特征。(2)提出地理场景中视频运动目标检索方法。为选出用户感兴趣的运动目标进行浓缩表达,需要进行视频运动目标检索处理。现有的视频运动目标检索方法的检索效率低下,对运动目标地理空间特征的的分析能力不足。针对于上述问题,本文提出了地理场景中视频运动目标检索方法。该方法基于运动目标轨迹聚类建模结果,通过将视频运动目标检索条件与视频运动目标轨迹类进行特征匹配,将轨迹类作为检索反馈结果。实验结果表明,该方法有效顾及了运动目标的地理空间特征,并使得检索结果更为准确。(3)提出地理场景中监控视频浓缩表达方法。当前以短视频形式表达的视频浓缩结果存在运动目标之间时序结构混乱,地理空间信息与视频运动目标信息融合表达能力欠缺等不足。针对上述问题,本文提出地理场景中监控视频浓缩表达方法。该方法基于视频场景空间化结果,选择虚实融合表达的模式,在虚拟场景中选取浓缩背景;基于轨迹聚类建模结果,构建基于轨迹类的视频运动目标表达模型;通过对上述处理结果进行有机组合,最终实现视频浓缩表达。实验结果表明,该方法有效保留了运动目标之间的时序结构性,实现了地理空间信息与视频运动目标信息的融合表达。(4)地理场景中监控视频浓缩方法性能评价。地理场景中监控视频浓缩方法是一种以虚拟地理场景模型为展现平台的视频浓缩方法,需要构建独立的评价体系对其进行性能分析。本文对地理场景中监控视频浓缩方法进行评价的内容包括:浓缩数据压缩性能,浓缩表达时长缩减性能,运动目标定位误差。对于每个评价内容,本文通过选取影响因子,构建相应的评价模型,最后通过分析实验结果做出性能评价。