论文部分内容阅读
目标检测、识别和跟踪是模式识别与人工智能学科中一个非常重要的应用领域,也是机器视觉的主要部分。在复杂的自然场景中,使用计算机信息处理技术,自动地分析场景、检测、识别和跟踪感兴趣的目标以获取目标的各种定性、定量的性质,从而获得对目标的准确、全面、可靠的图像描述,以构建某些复杂的应用系统,这是自动化、智能化的基础,也是当今信息科技发展需要解决的一项迫切任务。顺应上述目的,结合有关国家自然科学基金、华为创新基金等课题要求,选取了近距人脸和远距前视机场跑道两种典型目标作为研究对象。对近距人脸目标进行了检测,对远距前视机场跑道进行了检测和跟踪。并分别研究了它们各自相应的应用技术。主要工作可总结为以下几个方面:首先,对当前比较含糊的目标对象的概念进行了定义和区分。对当前近距人脸检测方法、远距前视机场跑道目标的检测与跟踪的研究现状、意义以及发展进行了分析和综述。研究了近距人脸目标的区域估计的快速算法:弦箭算法。算法可以提供较为可靠的和相对较小的人脸区域空间。由于算法不需要旋转平移和尺度缩放等耗时的匹配过程,因而速度很快,接近实时,保征了其在极低带宽码率下视频编码中的应用。并由此提出了基于H263/TMN8的前后景码率分配的控制技术,以及优化的量化编码次序等新技术,提高了视频图像的主观质量。研究了近距人脸局部器官(人眼)的精确定位方法。首先,使用矩形环梯度的方法进行人眼候选点的检测;提出基于动态HMM概率密度分布的检测模型及其训练方法,用该方法对人眼候选点进一步筛选;用人眼的虹膜网格采样的纹理图像转换矩阵以及利用纹理特征最终定位人眼位置。这一系列由粗到精的方法,共同实现了人眼瞳孔位置的高精度定位。实验表明,相对于Jesorsky等人的算法,在定位精度上有较大的提高。对远距前视机场跑道目标的检测与跟踪进行了研究。构造出远距前视机场跑道标记点的识别模型,以及使用自适应的聚类方法减少计算量的方法;设计了一种简化的基于命令式的时变镇定系统,利用粒子滤波器的非线性跟踪特性对检测结果进行了的跟踪补偿,使一些错误的检测结果得到了纠正,并获得了较高的检测率和较低的误差。最后,探讨了在无GPS辅助测量的情况下,利用前视跑道目标检测与跟踪的输出,实现无人机自主着陆时飞机方位和姿态的自动跟踪处理方案。设计了将双目摄像机、陀螺仪结合起来的联合测量模型和跟踪模型,为基于视觉的无人机解决测量和跟踪的精度问题提供了一定的理论依据。综上所述,所提出的这些新方法、新技术都具有良好的性能,对于其它类似目标的检测、识别和跟踪都具有重要的类比意义。这些理论,为机器视觉的一些实际应用打下了基础。