论文部分内容阅读
注意,是一切智能系统与外部世界打交道的第一环节,没有注意能力的智能系统必然会被外部世界信息的汪洋大海所淹没。因此,研究智能系统的注意能力具有重要的学术意义和实用价值。其中,视觉注意能力的研究又更加值得研究,这是因为,人们从外部世界接受到的信息,80%都是通过视觉系统接收并处理的。历史上,学术界(特别是认知科学界)对注意问题的研究已经积累了不少研究成果,例如Broadbent的过滤器模型,Treisman的衰减器模型等等。但是,所有这些模型都只研究了实现“选择信息”的各种可能的实现方法,而没有揭示注意能力生成的本质机理是什么。比如,过滤模型没有解释清楚:究竟依据怎样的准则来确定什么信息应当过滤?什么信息不应当过滤?衰减模型也没有讲明白:究竟依据怎样的准则来确定什么信息应当衰减?什么信息不应当衰减?如此等等。本文的研究发现:智能系统的各种能力(当然包括注意能力)其实都是为智能系统的目的(目标)服务的。因此,外来刺激的信息是否符合系统目的(目标)就必然会成为决定系统是否应当注意这个信息的根本依据:与目的(目标)有关的外来信息就要关注;与系统目的(目标)无关的信息就不需关注。有了这个新的发现,我们就意识到:钟义信教授所建立的“全信息理论”可以用来研究和揭示注意生成的机制问题,因为,全信息理论指出:事物所呈现的运动状态及其变化方式就是本体论信息,而认识论信息(全信息)的语用信息所描述的就是关于“信息相对于认识主体的目的而言的价值效用”。这就是说,语用信息量大的信息就对主体目的(目标)的价值效用大,反之就小。因此,可以把语用信息的大小作为是否需要关注的根据。本文的第一个创新成果就是:在全信息理论指导下研究和阐述注意能力的生成机制和模型,并讨论这一模型与现有各种模型的关系。其次,针对目前视觉注意计算模型的研究中存在的一些问题进行了相关研究,提出了三个视觉注意计算模型。具体的内容主要包括以下几个方面:(1)通过研究不同特征的融合方法,提出了一种基于特征加权的视觉注意计算模型。不同的特征对于物体的显著性具有不同的贡献,比如有的物体颜色鲜艳,其颜色特征相比朝向、亮度等特征的贡献就更大,而一个棱角比较分明的物体,其朝向特征对其就显得更加重要。因此,不同特征通道应该具有不同的权重系数,而且应该根据物体自身的特性来设置相应的权重系数。本文根据对物体自身的特征显著图的分布情况,计算各自特征的权重系数,进而调整总的融合显著图,得到更好的注意焦点。在ALOI图像库及其扩展库上进行了实验验证,取得了较好的识别结果。(2)通过研究特征空间分布对于模型的影响,提出了一种基于高斯混合的视觉注意计算模型。现实世界中的物体以各种不同的姿态呈现在我们的视觉系统中,形成了一个相对稳定的物体模型,其实际样本的多样性使得用单一的高斯假设变得不合理,而传统的视觉注意计算模型对于图像数据中待识别目标物体的建模就是采用最简单的高斯分布假设或者干脆不做假设,仅凭视觉显著点进行物体的检测和识别,使得现有的视觉注意计算模型的识别率不高。因此,本文依此进行了模型改进,用高斯混合模型替换原来的单高斯模型,可以更好地对目标物体进行表征,使模型对于物体的拟合程度更高,从而提高识别率。在ALOI图像库上进行了实验验证,取得了较好的识别结果。(3)通过对颜色特征的重要性及表示方法进行分析,提出了一种基于CIELab的视觉注意计算模型,并成功运用在交通标志的检测与识别任务中。在人类视觉系统接收到的刺激中,颜色是最重要的一类。常用的颜色表示方法有RGB、CMY、HSX、CIELab等。在众多颜色空间中,CIELab的设计思路与人类视觉系统对于颜色的感知机制最为吻合。但遗憾的是,目前的视觉注意计算模型多以RGB颜色空间作为特征。因此,本文提出了一种基于CIELab的视觉注意计算模型,将原模型中的颜色特征空间由RGB变换到CIELab中,并对特征进行了一些独到的设计,使模型对于颜色对比信息更为敏感,在禁止返回机制中加入了自适应阈值控制,使模型对样本的颜色变化能动态适应,在针对拥有丰富色彩的目标物体(如交通标志)的识别任务中取得了很好的效果,体现了无需分割、仿生性强、识别效率高等优点。