论文部分内容阅读
图像分类和视频图像分析是当今学术和应用领域广为关注的热点内容,对简洁图像管理和检索,应对视觉信息膨胀具有十分重要的意义。但由于实际应用中的图像表现出不确定性和模糊性,使得图像表述和分类十分困难。为了减少这些不确定性和模糊性对图像表述的影响,利用多特征信息以及多种上下文信息成为当前图像和视频分析的潜在趋势。本文围绕图像内容表述、分类以及视频行为分析,深入研究了利用贝叶斯网络(Bayesian Network,BN)挖掘图像内部空间上下文以及视频图像数据中的时空上下文,并将多特征和上下文信息融合到统一的概率框架中。在图像的局部内容表述方面,主要研究了融合上下文信息的局部语义建模方法,并用于图像标注和分类中。(1)提出了利用语义上下文信息的贝叶斯网络局部语义模型(Contextual Bayesian Network for Semantic Objects, CBN_SO),区域语义标注误差明显地低于仅利用低层特征的方法。(2)提出了一种自动学习局部语义上下文的贝叶斯网络模型(Learned Bayesian Network, LBN),能够针对不同的局部语义对象,学习得到各自的空间关系节点集。(3)提出了一种基于LBN的高分辨遥感图像地物分类和检测方法,能够自适应的学习各种地物的空间上下文信息,实现智能和有效的分类。在图像的场景语义建模方面,提出了一个新颖的场景上下文贝叶斯网络模型(Contextual Bayesian Network for Scenes, CBN_S)用于自然场景建模和分类。模型引入了图像的关键语义区域及其邻域作为上下文节点,通过关键语义区域及其邻域的空间关系简洁灵活地表示场景的空间配置,克服了以往方法中对场景结构利用不足或者难以建模的问题。同时,CBN_S模型将图像的局部语义特征和空间上下文信息通过贝叶斯网络融合到统一的概率框架下,能够较好的区分易混淆的自然场景图像。在视频行为分析方面,针对实际场景中涉及多类目标的交互行为,论文主要研究了基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)的行为建模和识别。在定义分层次交互行为和基于场景事件的行为描述方法的基础上,提出了一种多观察值层次动态贝叶斯网络模型(Hierarchical Multi-obsevation Dynamic Bayesian Network, HMO-DBN)。模型将目标的空间关系作为隐节点,并考虑其在时间上的动态变化,是有效利用视频数据中存在的时空上下文信息进行交互行为建模的关键部分。将研究的方法以及提出的模型用于自然场景、遥感图像分类,以及视频行为分析中,取得了预期的结果。