论文部分内容阅读
随着计算机和媒体技术的迅速发展,计算机视觉技术在各个领域中受到了极大的关注。作为计算机视觉领域中最具挑战性的研究热点之一,视频对象处理涉及计算机、电子学、数学、人工智能、信息处理等多个学科,并在工业、农业、军事、气象及遥感等领域中得到广泛的应用,由此可见,视频对象处理的研究不但具有重要的理论价值,而且还具有极其重要的实际应用价值。然而,国内外对视频对象处理的研究中仍然存在一系列难题,需要我们做进一步的研究。因此,本文在国内外的研究基础上,以概率模型为工具,围绕视频对象处理中的难题,进行了深入的研究,主要的研究内容和创新性工作可概括如下:(1)为了克服传统视频对象分割算法的缺陷,论文中提出了一种新的基于高斯混合模型的视频运动对象分割算法,该算法首先根据视频的时序属性,将视频的背景和前景(运动对象)分割出来;然后根据视频对象的空间属性,在第一次分割的基础上,利用最近邻原则,对视频运动对象进行第二次分割;最后,通过对视频进行去噪,去孤点等操作之后,便能可得到准确的视频运动对象。(2)针对传统高斯混合模型的参数估计与模型选择中出现的问题,本论文做了相应的研究,即:针对利用传统EM算法进行高斯混合模型模型参数估计时,易陷入解空间的局部最优的缺陷,本文采用逆Wishart先验作为似然函数的惩罚项,对EM算法进行了改进;其次,当视频分割不需要满足实时性时,本文提出了一种基于差分进化算法的高斯混合模型参数估计法;另外,本文还提出了一种基于非平稳性度量的高斯混合模型模型选择准则。(3)针对利用视频分割算法所提取的视频对象的分类问题,本文提出了一种基于最小误判概率贝叶斯准则的视频对象分类算法,其主要思想是寻找一个正交线性变换,把d维的原始视频对象的特征空间映射到m维的特征空间,从而使得变换后的误判概率上界最小。(4)针对特殊场合下的视频人脸分类识别问题,本文提出了一种视频人脸分类识别的算法,也就是,为了克服主成分分析算法的缺陷,本文将视频人脸图像的特征矩阵划分成若干个子块,这样就使得各个子块的图像数据更近接高斯分布,然后,在这个基础上,再利用主成分分析的方法对其进行特征选择,并根据基于最小风险的贝叶斯分类规则对它进行分类识别。(5)针对复杂环境下的视频文本的抽取与识别问题,本文提出了相应的视频文本抽取与识别的算法,即:首先将视频文本进行多分辨率分解,然后,对文本图像的标记场和特征场进行建模,利用马尔科夫链蒙特卡罗参数估计算法对所建立标记场模型进行训练,并根据训练好的模型进行推理,也就是,利用最大后验概率方法来获得全局的优化标签分布,从而有效地实现视频文本的抽取。最后,针对抽取的视频文本,设计了一种基于支撑向量机的视频文本识别算法。(6)针对基于传统粒子滤波的视频对象跟踪算法的缺陷,本文在动态贝叶斯网络框架下,提出了一种基于融合多特征的退火核粒子滤波的视频对象跟踪算法,该算法中提出了融合多特征的退火建议分布,同时,使用基于模拟退火的粒子抽样来代替传统的基于先验概率的粒子抽样。并且在逼近的过程中,利用融合颜色、形状及纹理的视频对象特征属性,在不同的退火层,以加权的方式来产生相应的加权似然函数,实验表明该算法能有效地防止粒子的匮乏。(7)本文对视频人体行为的识别进行了研究,并提出了一种基于隐马尔科夫模型的人体行为理解算法,即:首先设计出一种视频人体行为特征矢量量化方案,也就是,本文中所提出的一种基于遗传算法的码书设计方案及基于二次型失真测度的码字搜索方案;然后利用这个矢量量化方案,对视频对象网络特征进行矢量量化。最后对所构造的DHHM进行训练与推理,并利用这个模型对视频人体行为进行识别。