多尺度表达和正则化方法在图像识别中的研究与应用

被引量 : 4次 | 上传用户:guyisun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动设备的不断普及和互联网的持续发展,以图像为载体的信息交流方式越来越普遍。如何能够自动理解拍摄图像传达的语义信息是人们实际且迫切的需求。图像识别作为解决这类问题不可或缺的手段,主要关心如何对图像中的物体及对其所处的场景进行分析判断。通常,物体识别包括个体识别、次级类别识别以及类别间的识别,而场景识别(又称为场景分类)则是根据图像内容给出其代表的语义标签(如山脉、海岸线等),可为物体识别等任务提供有效的上下文信息。为解决这两类模式识别问题,本文从对图像识别系统关键模块的现状分析出发,重点研究了特征设计中的多尺度信息和方法论中的正则化手段在图像光照预处理、人脸性别识别、物体识别和场景识别中的应用。首先,针对光照条件对图像识别的影响,本文考虑解决光源变化带来的图像颜色漂移问题,以达到色彩恒常目的。目前,不存在任何一种通用的单个色彩恒常算法能适用于不同纹理特性的图像。为此,提出一种基于纹理金字塔特征匹配和正则化局部回归(TPM RLR)的色彩恒常算法来融合单个算法的光照估计结果。TPM RLR算法结合多尺度表达构建纹理金字塔,并利用威布尔分布参数提取图像的纹理特征。然后,根据自定义的图像相似性测度查找到与待校正图像纹理最相似的参考图像集。在融合阶段,综合基于先验知识的方法与基于数据驱动方法的优点,在lαβ对立色彩空间内采用正则化局部回归合并单个算法。在两个自然图像数据集上的实验结果表明,TPM RLR融合算法能显著提高光照估计的准确度,其角度误差中值比单个算法至少降低了29%,同时其校正效果在主观和客观评价上均优于现有的融合算法。其次,以人脸这种特殊物体为研究对象,讨论了基于人脸的性别识别问题。首先,提出一种基于多尺度学习模式(MSLP)的人脸特征,该特征通过不同方法PCA/ICA/K-means学习得到多尺度卷积模板,然后对卷积后的图像按照响应强度顺序进行编码,从而形成一个紧凑且具有较高鉴别力的直方图特征来描述人脸。鉴于线性表达分类器(LinearRC)在人脸识别中的成功应用,同时又考虑到性别识别和人脸识别在数据分布上的差异,系统分析了LinearRC在性别识别上的应用。另外,从原型生成的角度出发,提出一种基于偏最小二乘的线性表达分类器(LRC PLS)及其群组分类器。在人脸性别识别上的大量实验证明,MSLP特征明显优于人工设计特征,LRC PLS较其他线性表达分类器性能稳定、耗时较短,且其群组分类器可进一步提高识别精度。鉴于原型概念在性别识别中的成功应用,从字典学习角度出发,进而提出一种基于多尺度查询图像扩展的协同表达分类器(QCRC CP),以解决较复杂环境下的物体识别问题(即处理多姿态的、多视角的、更一般化等情况下的物体识别)。QCRC CP先将单张查询图像通过放缩扩展成一个查询集,并利用典型相关分析生成与查询集最相关的一组类原型作为每一类的字典原子。这种字典构造方法结合以往原型选择方法与原型生成方法的优点,利用数据局部性剔除掉噪声,生成与查询样本相关且最能代表该类别的原型集。最后,在新构造的字典上,采用基于最小规范化残差的多变量协同表达分类器判定查询图像的类别。在多姿态人脸识别、树叶类别识别、字符识别和通用物体识别上的实验表明,QCRC CP分类器获得了令人满意的结果,且其字典构造方法优于基于原型选择和原型生成的字典学习算法。例如,QCRC CP在字符识别上的识别率比其他线性表达分类器提高了10%以上。最后,在场景识别中,考虑到合适的距离度量能有效反映高维空间中样本间的语义距离,提出一种基于正则化线性判别分析(RLDA)的全参数马氏距离度量学习算法。当训练样本数目少且特征维数高时,距离度量学习算法复杂度过高,且容易出现过拟合问题。为此,提出一种新的算法框架,即将度量学习的参数矩阵分解为一个射影矩阵与一个非负对角阵的乘积,从而可显著降低要估计的参数个数。首先,采用不同参数调制的RLDA生成一个射影向量集合。然后基于边信息,在构建的训练数据集上通过l2范数正则化的非负最小二乘对射影向量进行选择和加权。该训练集是由射影后的相似样本对子集与相异样本对子集中样本对的差向量平方组成。另外,为了保持训练库中两个子集样本数目的相对平衡,提出一种基于K近邻的简单却有效的策略。在两个场景图像集上的实验表明,所提方法较其他度量学习方法能够获得更好的场景识别效果,且运行速度是传统度量学习方法的几倍、甚至几十倍。
其他文献
目的探讨新生儿高胆红素血症的病因、换血有效性及风险与急性胆红素脑病(ABE)程度的关系。方法回顾性分析2001年1月~2011年12月在本中心接受换血治疗的516例新生儿临床资料。结
研究背景良性前列腺增生(Benign Pro static Hyperplasia,BPH)是老年多发病和慢性病。国际泌尿外科指出没有严重并发症的BPH患者的就医主要目的在于减轻症状,提高生活质量。
随着互联网近二十年的快速发展,人们的衣食住行已经离不开互联网,也越来越多的人在互联网中投入大量的时间和金钱,互联网不仅仅具有精神价值,更具备经济价值,例如:网店、VIP会员、游戏装备等等,而当用户去世后,这些网络虚拟财产的归属如何,是由继承人继承,还是由运营商删除或者再利用,这些问题我国法律都没有明确的规定,法律的滞后导致了在司法实践中出现网络虚拟财产继承案件时,不同地区甚至同一地区均出现了同案不
党的十八大以来,国家越来越重视弘扬传统文化的重要性,要求高校思想政治教育要把弘扬传统文化作为重要抓手。本文正是在这种形势下,分析了传统文化在高校思政教学中的现状,主
淀粉是高分子碳水化合物,天然存在的多糖类,由两种多糖分子组成,即直链淀粉和支链淀粉,一般情况下,两者的比例相当稳定,大多数谷类淀粉含直链淀粉在20-30%之间。由于分子内氢键的作
目的:观察针刀松解颈周腧穴对颈型颈椎病患者VAS,PPI,颈椎生理曲度,颈椎主动活动度的影响,同时与推拿对照组比较,评价针刀松解颈周腧穴治疗颈型颈椎病的临床疗效,验证此新方案的优
年糕是我国南方传统的节令性食品,但由于其水分含量高,营养丰富,极易导致微生物生长和繁殖,且易导致其品质在后期的贮藏、运输和销售过程中发生不同程度的劣变。年糕生产过程中的
糯米作为一种稻米品种,是生产中国传统食品—汤圆的重要原料。其淀粉中支链淀粉含量可达到95%以上,因而具有弱凝沉性,抗老化性和良好的冻融稳定性,特别适合于冷冻及冷藏食品的加
大豆蛋白质是植物性的完全蛋白质,具有较高的蛋白营养价值。目前市场上出现的大豆蛋白产品有粉状大豆蛋白产品和组织化大豆蛋白产品两种,但是传统组织化大豆蛋白产品不可即食
研究背景:阿尔茨海默病(Alzheimer’s disease, AD)是一种常见的神经退行性疾病,其主要特征是进行性的不可逆转的记忆和认知功能衰退,主要的病理学变化包括胆碱能神经元丢失。神