基于核方法的图像识别算法研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 5次 | 上传用户:iammycsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别在现代社会生活中正发挥着越来越重要的作用,而特征表达和特征建模(分类器模型设计)是图像识别中的核心任务。由于目标本身及背景的模式复杂性,再加上拍摄环境、光照、遮挡等因素的影响,物体在图像中往往呈现比较复杂的表观,单一特征和简单识别模型常常无法很好地对图像中的物体进行准确刻画,从而经常导致较低的识别率。多特征融合是解决这一问题的一个有效途径,本文从浅到深,依次探讨了基于多核度量学习的特征融合算法,基于多核支持向量机的特征融合算法,以及基于集成多个核分类器输出的后特征融合算法。并针对具体的图像识别问题给出了实验系统和结果分析。论文的主要贡献包括如下三个方面:(1)提出了一种多核相似性度量(MKSM:multiple kernel similarity metric),用解决基于面部图像对亲属关系验证(KV:kinship verification)问题。与以往的基于线性度量的方法不同,所提出的MKSM本质上是多个基核相似度的线性组合,根据基核选择的不同,该多核度量总体上既可以是线性度量也可以是非线性度量,这样不仅改善了度量表示和学习的灵活性、增强了度量的表达能力,同时也实现特征融合的功能。另外,为了求解所提出的MKSM度量的模型参数,提出一种最大间隔(LM:large margin)准则,该LM准则最终转化为带有对基核系数向量L1范数约束的最优化问题,问题的求解最终导致稀疏的基核系数向量,从而实现KV问题中的特征选择,并提高在预测阶段的效率。在公开数据集上的实验结果表明,仅仅使用极少量的局部特征,所述算法就能实现与其他最先进算法相匹敌或者更优的性能。(2)提出一种基于间距最大化的两步骤多核学习算法,分别采用基于近邻的样本间距最大法(MCKM-k NN:multi-class kernel margin with k-nearest neighbors),和基于稀疏表达的样本间距最大法(MCKM-SR:multi-class kernel margin with sparse coding)来来学习组合核函数。与其他基于核间距的方法不同,在MCKM-k NN中,我们用基于k近邻的样本-类间距来代替以往算法中的基于平均方案的样本-类间距,从而在分类性能上取得了显著的提升。不同于MCKM-k NN方法中使用固定的近邻数目以及固定的近邻权重1/k,在MCKM-SR方法中,通过求解稀疏表达问题,来确定每个样本-类间距计算时所用的近邻数目k以及相应的近邻权重,实验证明相比于MCKM-k NN法,MCKM-SR法在分类精度上有更进一步的提升。(3)针对于手势检测容易受到动态场景和复杂背景影响的问题,提出了一种以支持向量机(SVM:support vector machine)作为转换函数的多特征融合方法。在该方法中,首先,分别基于传统特征和肤色增强特征为每个手势训练单独的SVM分类器,作为更高层更抽象的特征提取函数,接着将同类手势的所有SVM的输出用逻辑回归(LR:logistic regression)进行融合(后特征融合)以实现对单一手势的检测;最后使用Softmax回归将所有手势所对应的SVM输出值进行融合,用于在多个手势及困难背景之间进行多类分类以进一步降低混淆率率和误检率。另外,针对多类手势检测问题中效率低混效率高的问题,还提出了一种级联的Softmax检测框架,不仅可以有效提高检测效率、减少手势间的混淆,而且形式更简洁,训练更方便。在一个复杂的静态手势数据集上的实验证明了,所提出的SVM+LR方案、和级联Softmax方案的有效性。
其他文献
该文从鲁迅思想最为核心的基点——"人学"思想出发,对鲁迅的戏曲批评进行了分析研究,认为迄今为止,学界对于鲁迅戏曲批评的研究在取得一些成就的同时也存在着将鲁迅简化、提
<正>华生所创立的行为主义是美国现代心理学的主要流派之一,在西方心理学界占据支配地位长达半个世纪之多,这是其他心理学派别所无可比拟的。正因为其影响与地位如此巨大,遂
目的:系统评价氟西汀治疗肥胖伴2型糖尿病的临床疗效及其临床应用价值。方法:计算机检索PubMed、EMBASE、SCI、Cochrane Library、中国生物医学文献数据库、中文科技期刊全文
在我国经济飞速发展的背景下,节能环保的需求显著提升,绿色建筑应运而生。为贯彻节能环保的可持续发展理念,必须在施工过程中充分应用绿色建筑施工管理的各种方法。论文对绿
高比表面积和特殊结构所衍生的突出物理化学特性使TiO2纳米管薄膜在光催化,气敏,光解水和光伏等应用领域具备极大的应用潜力,因此制备性能优异的TiO2纳米管薄膜以及发掘其应
完善广告监管执法机制,需要统一广告行政审查机构,对小额广告侵权进行行政调解,用代执行配合责令公开更正的实施,依法移送涉嫌广告犯罪的案件。
柚木(Tectona grandis L.f.)属马鞭草科(Vcrbenaceae)柚木属(Tectona)的树种。因强度、耐磨性和持久及诱人的外观而闻名于世,是国际市场上最受欢迎的硬木树种之一。由于过度砍伐,柚木天
天然药物化学课程是药学专业中一门重要的基础课程。如何针对成人药学教育对象的特殊性和学习的阶段性来优化课程讲解内容,把握教学的深度和广度,最大程度地利用有限的课堂教
我国服务供应链的研究从2003年起步以来,研究的广度和深度都在持续延展。采用文献计量分析法,依托中国知识基础设施工程数据库,将国内10年来关于服务供应链的研究文献进行了
本研究通过采用内容分析法对在线品牌社群的网站内容进行分析,以汽车品牌论坛成员的互动关系进行分类,并对成员在这些活动中产生的心理活动进行研究分析。作者为了研究活跃度