2.5 维帧间运动估计方法

来源 :清华大学学报(自然科学版) | 被引量 : 21次 | 上传用户:flysnake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图象点深度变化对常用的基于仿射模型的帧间运动估计方法精度影响比较大。针对这种问题,引入了特征点深度相关参数,得到一种基于2.5维模型的帧间运动估计方法。在应用于视频图象序列稳定问题时,数值实验结果证明在图象中景深变化较大的情况下,这种新方法估计的参数比基于纯仿射模型的方法准确,同时还可以得到对图象点相对深度信息(磁撞时间)的粗略估计,而计算量增加很少。
其他文献
在颜色物体识别等应用中,获取不随光照变化的颜色恒常性特征是问题的关键。监督颜色恒常性方法,即通过在环境中放置校正用的颜色片来计算并消除光照的影响,由于其简单方便而得到了广泛的应用。在本文中,基于对直方图光照不变量的分析,提出了一种新的监督颜色恒常性算法。该算法与传统算法相比较,不需要知道颜色片的反射率和成象系统的通道响应,从而大大简化了实现的要求。文中给出了算法的基本思想,并对实验结果进行了分析。
期刊
本文提出基于全方位时空图象的多尺度视觉导航方法。其基本思想是根据具体视觉任务(道路识别、障碍物检测和全局定位)的要求,采用不同时空尺度的视觉传感器和处理方法,将空域大尺度的全方位“环视”,小尺度的双目“注视”和时域大尺度的时空“远视”相结合,综合完成道路图象的理解。设计了适于机器处理的特殊传感器和快速有效的处理方法,并利用图象级的不变性避免了困难的图象分割和三维恢复。
期刊
为获得较高的说话人辨识正确率,同时减小辨识系统的时空开销,提出了一种复合策略的辨识系统。采用长时平均频谱作为粗识的特征,定义了相应的辨识判别准则。建立mel-倒谱特征的高斯混合模型(GMM)进行第二步辨识。给出了GMM求解算法的一种简便推导,着重研究了判别阈值,预加重系数,GMM阶次,训练语音长度及辨识语音长度对系统辨识性能的影响。
期刊
以田间实验为基础,分析了在不同厚度的有机物覆盖层下土壤温度变化的机制并与未覆盖条件下的土壤温度进行了比较。实验结果表明,有机物覆盖使土壤的日最高温度和日平均温度降低,但却使土壤的日最低温度得以提高。
期刊
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很
期刊
提出了一种用于二维轮廓线数据集显示的快速投影方法。首先,基于二维轮廓线数据给出了一种生成投影单元的集合运算方法,为了加速投影运算,将投影单元分为同类单元和界面单元两种,然后分别给出了这两种单元的投影方法:对于同类单元,给出了投影多边形各象素的颜色和不透明度的线性插值方法及其缓存技术;对于界面单元,给出了不同物质分界面的光照技术。结合医学解剖切片数据和核磁共振成象(MRI)数据实现了提出的方法,结果
期刊
提出了一种由轮廓线定义的任意复杂形状的物体的三维重构的通用方法。对于其中的两个难点(对应性问题和分支问题),分别给出了解法。为了使提出的方法适用于含洞型(奇异型)分支问题,先用包围盒测试轮廓线之间的拓扑包含关系,再用一种法则确定相邻切片上轮廓线之间的对应关系。将分支问题分解为非奇异型或奇异型的单分支问题。此方法被用于断面解剖学中的人脑蝶鞍区切片的三维重构中,得到非常满意的效果。
期刊
镜头切分是实现对动态视频基于内容检索的第一步,以检测出来的镜头作为基本单元,可以进一步对视频内容进行分析和建立索引。从实用角度看,目前越来越多的动态视频资料都是以压缩形式存储和传输,所以,研究基于压缩视频流的算法更有实际意义。本文旨在提出一种基于MPEG国际标准压缩视频流的镜头自动切分算法,通过利用MPEG数据流中已有的信息,如离散余弦变换(DCT)系数和运动向量,只进行最小程度的解码,来检测镜头
期刊
根据车辆自动引导系统在车辆工程中的应用及发展趋势,开展了用计算机视觉技术进行车辆有线引导的基础研究,描述了系统的基本组成及其主要功能,分析了影响视觉输入的各项基本因素。根据哈夫(Hough)变换的基本原理,设计了引导路线检测的算法,通过典型引导路线特征图象的试验分析,验证了算法对直线特征的检测性能、对复杂背景下直线检测的可靠性和对实际道路中的中心引导线检测的有效性。分析了控制模型中实用视觉系统检测
期刊
该文提出了在显示器分辨率为EVGA的计算机屏幕上,绘制气象要素时间变化曲线的思路,给出了在同一显示屏上,开设多个显示窗口(WINDOWS),模拟动画、图形局部放大、不同类别图象窗口快速切换等技巧,可供基层台站在业务工作中参考使用。
期刊