统计流形框架下视觉特征的嵌入与目标识别

被引量 : 3次 | 上传用户:peiyingbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
颜色、纹理和形状是最基本的视觉特征,人们常用其来描述图像的属性,并广泛应用于目标识别任务。多尺度高斯导数滤波器和Gabor滤波器是构造图像局部形状和多谱纹理描述子的常用工具。在分析和应用时,通常将输入图像与一组高斯导数滤波器或Gabor滤波器的卷积输出作为多通道或多谱图像。这种多通道滤波图像与常见的彩色图像类似,具有局部多维和全局高维特性。全局方法习惯将所有通道逐像素点的滤波响应串联成一个高维向量。然而,在识别或学习等应用中,特征向量高维属性容易导致“维数灾难”,使得算法失效或输出次优结果。尽管下采样或其它压缩技术可以在一定程度上克服这些问题,但都是以丧失大量信息为代价。共生矩阵本质上是一种离散的概率分布,它利用像素特征空间上的共生信息描述图像纹理。传统方法常采用从共生矩阵中进一步提取Haralick特征,这时出现的问题是无法使用共生矩阵的全部统计信息。直方图是一种广泛使用的图像描述子,不过,目标图像与高斯导数或Gabor滤波器卷积生成的逐像素响应集大多呈现复杂的分布。在识别任务中如何从这些特征集中抽取判别直方图并赋予恰当的信息度量就显得十分重要。另外,直方图的非欧几何结构使得经典学习算法对其学习时难以得到令人满意的结果。针对上面提及的图像/滤波图像视觉特征用于识别和学习过程中所出现的问题,在统计流形框架下,本文考虑逐像素特征/共生特征的概率生成模型。通过使用模型离散化(仅针对非参数的概率模型)和紧致化嵌入技术,在(积)多项流形上借助(因子流形的)费舍尔-黎曼(Fisher-Riemannian)几何导出了生成模型间相似性度量。在此基础上,提出了基于特征/共生特征概率生成模型匹配的目标识别方法和基于随机直方图嵌入的统计流形学习方法。本篇论文的工作、主要成果和创新包括:(1)提出了基于特征/共生特征概率生成模型的目标表示。即利用目标图像/滤波图像上逐像素点的特征集的联合(或边际)生成模型,将目标表示成为某个(积)非参数统计流形上的点。利用图像/滤波图像上共生特征的生成模型,将目标表示成一个(积)多项流形上的点。这些目标表示方法是本文算法设计的基础。(2)理论上,证明了用多项流形的费舍尔几何来研究无限维非参数统计流形的某个子流形的合理性。应用上,给出了由非监督学习的分位点确定的模型离散化方法。为了获得与模型几何相适应的信息度量,采用了离散化模型的极大似然嵌入和嵌入的紧化技术。并对嵌入的(积)子流形赋予了由(因子)多项流形上测地距离导出的信息度量。由此,提出了基于特征概率生成模型匹配的目标识别方法。实验结果表明:当应用多通道Gabor特征或高斯微分特征进行目标识别时,该方法能在不同类型的目标库上获得较好的识别性能。(3)通过引入紧化的(积)共生矩阵嵌入,提出了在嵌入(积)子流形上匹配灰度/颜色共生矩阵的目标识别方法。为了将这种方法加以推广,本文设计了一种新颖的图像描述子—Gabor幅值共生矩阵。通过对多项流形上的测地距离度量的延拓,提出了匹配Gabor幅值共生矩阵的目标识别方法。实验结果验证:本文提出的识别方法在性能上明显优于经典(核)子空间方法和Haralick特征匹配的方法。(4)提出了基于随机直方图嵌入的统计流形学习方法。该方法不刻意追求从数据或特征集中抽取最优直方图,而是强调通过抽取多个低分辨率的随机直方图和紧致化嵌入,在积多项流形上对其判别信息加以整合。在嵌入积子流形上将经典流形学习算法和本征维数估计算法调整成与导出度量相适应的形式,由此实现积子流形的低维欧氏嵌入。实验结果证实,该方法在特征提取以及目标或数据集的可视化方面均有很好的表现。
其他文献
本文针对连续刚构施工、监控、运营中的最关键问题,以S103线渝巴路南岸区茶园至涪陵区李渡段二级公路改建工程高朝门大桥为工程背景,利用有限元分析为手段,研究了连续刚构合
阅读并赏析英美经典文学作品,不仅有利于学生熟悉西方文化背景,还有利于学生发现中西文化的不同,尤其是对部分英美经典文学作品的赏析,有助于学生体会西方文学语言在人物刻画
金沙江流域贫困地区财政困难,却要为本地区以外的多个地区提供大量的生态服务,既得不到必需的补偿,又常常因为担负着保护水源、生态林、湿地、生物多样性等环境责任而限制了当地
本文认为,近体诗声律模式的物质基础是由声调的超音段特征即调形(平与非平)、音高(低调与高调),及隐性特征的延长性所构成的。对以前的学者所论的长短说、调形说等观点提出了
所有权保留制度在各国得到普遍的认可和实行并日益完善。国际货物买卖实践中所有权保留制度也起着十分重要的作用。但是由于各国社会背景、法律体系不同,导致对所有权保留制
数能力作为儿童认知发展的重要方面一直是心理学关注的问题。近些年来,国外手指动作与早期数能力关系研究越来越受到研究者的重视。笔者通过发展心理学与认知神经科学两个视
[目的]了解癌症病人应对方式、社会支持状况与抑郁的关系。[方法]采用医学应对问卷、社会支持量表和抑郁自评量表对100例已知诊断为恶性肿瘤病人进行测评。[结果]本组病人抑
目的:探讨PKCαNrf2 HO-1通路在兔内毒素休克诱发急性肺损伤中的作用。方法:健康清洁级大白兔70只,雌雄不拘,2月龄,体重2.O~2.5 kg,随机分为7组(n=10):对照组(C组)、模型组(M
<正> 这是一本系统地研究中国近代民主思想的专著,是作者熊月之在详细掌握资料的基础上写成的。全书近40万字。陈旭麓教授在序言中说:"这是一本取材甚丰、论旨鲜明而有色泽的
<正>随着我国市场经济的迅速发展,合同诈骗罪的社会危害性日益严重,合同诈骗罪是指以非法占有为目的,在签订、履行合同的过程中,采取虚构事实、隐瞒真相的方法,骗取对方当事