论文部分内容阅读
本文研究的主要目标是,开发无需人工设置参数的、快速、鲁棒、准确、自适应的检测视觉显著性直线的算法框架。直线检测是图像处理和计算机视觉的一个基本任务。直线检测要解决三个基本问题:一、什么是直线?二、直线在哪里?三、直线有几条?围绕三个基本问题,本文以霍夫变换为主要途径,对视觉显著性直线检测及其应用做了四个方面的研究,主要内容包括:1、就“什么是直线?”展开研究。详细研究数字图像处理中的直线与线段的定义,构造了一个感知视觉显著性直线的信心函数,提出一种尺度效应下判别视觉显著性直线存在的定量分析方法,自适应地确定阂值,从而为解决这一根本性问题打开一扇窗户。2、就“直线在哪里?”展开研究。研发一种基于边缘的容错投票和线段投票机制的新算法——混合霍夫变换(Hybrid Hough Transform)。直线检测通常面临的是一条视觉感知意义上的边缘不齐、断裂、残缺的直线,这条直线并不严格符合直线的数学解析式。考虑到直线包络区域内的线段在数字图像中呈阶梯状分布的基本特性,引入容错投票和线段投票,尝试解决霍夫变换中的投票效率低下的问题,达到定位人类视觉显著性意义上直线的目的。3、就“直线有几条?”展开研究。研发一种基于直线支持区域的自动去伪直线算法——局部快速均值飘移算法。基于边缘的直线检测方法通常产生大量伪直线,利用混合霍夫变换初步定位的结果,开发基于区域的局部快速均值漂移算法,以解决伪直线簇拥的问题,达到辨别视觉显著性直线的目的。4、在上述研究基础上,提炼出两个直线检测算法框架,直线检测可以划分为直线定位、辨别、确认三个阶段。(1)自顶而下的直线检测算法框架。首先,运用混合霍夫变换来快速定位直线的支持区域。在定位区域内引入容错投票和线段投票机制,实现阈值自动选择,从而实现直线快速鲁棒地定位;其次,根据上一阶段检测出的候选直线,采用局部快速均值漂移算法,消除了大量伪直线;最后,根据直线的一般特征,拟合直线方程,即确认阶段。三步法最终实现无需人工设参、快速、鲁棒、准确的直线检测。(2)自底向上的直线检测算法框架。提出一个融合局部特征描述子(LSD,线段检测子)与局部快速均值漂移算法(Fast Regional Mean Shift)的直线检测方案。首先使用LSD确定侯选直线段;其次,对候选直线段运用局部快速均值飘移算法,确立视觉显著性意义上直线的锚点,抽取直线;再次,精确拟合直线方程。在机器解答的具体项目“智能化教育系统中的小学应用题自动求解器研究”中,对于数学试卷中的几何图形智能识别任务,综合应用上述方法,取得了一定的效果。首先,它是一个无需人工设置参数的自动检测方法;其次,由于采用容错投票和线段投票机制,本文提出的混合霍夫变换算法相对于累积概率霍夫变换(OpenCV)速度提高了一倍;再次,由于采用局部快速均值飘移算法,为解决伪直线提供了一个新技术。两个算法框架达到了无需人工设置参数,快速、鲁棒、准确、自适应的要求。