基于多特征融合的图像分类算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:walker1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网技术的发展,每天产生的图像信息爆炸性增长,面对这么多的图像,我们更希望了解图像表达了什么信息,这就产生了图像分类技术。图像分类技术在现在已经应用到生活的各个方面,并且有很大的研究意义和价值,一个好的图像分类算法可以在很大程度上减轻人工分类的负担,快速的处理图像信息,现在已经成为计算机视觉领域重要的研究方向之一。
  本文在传统的图像分类框架基础上,提出了基于显著性检测和目标定位的多特征融合图像分类算法。传统的图像分类方法一般提取单一的特征对图像进行分类,并且都是对数据集里面的图像直接进行操作。传统图像分类算法的一般流程:首先,提取局部底层特征;然后,利用训练集图像提取的局部底层特征训练大小为K的视觉词典;随后,利用特征编码方法和视觉词典对提取的底层特征进行编码;最后,训练分类器进行图像分类。本文主要做了以下几个方面的工作:
  (1)图像预处理方面,在SEG显著性检测算法的基础上,提出了图像目标区域的分割和定位算法。首先,使用SEG显著性检测算法得到原图像的显著性图像,即概率图;然后,利用大津法阈值分割算法对显著性图像进行阈值分割,得到二值图像,并利用形态学处理的相关知识去除细小的噪声点;之后,寻找候选目标区域,本文提出的方法是寻找大于等于最大连通区域1/10的区域作为候选目标区域;最后,根据候选目标区域完成目标区域的选取。
  (2)提取了三个不同类型的底层特征。由于单一的特征对于图像的描述能力太弱,不足以描述图像的所有特征信息,所以本文运用了多个不同类型的特征来描述图像信息。本文主要提取了三个底层特征:密集SIFT特征、HOG特征和Garbor特征。密集SIFT特征与传统SIFT特征的不同在于对图像进行密集网格采样,然后提取网格内的SIFT特征,这样既能提取局部信息又能描述全局信息。Garbor特征是使用平均分块的图像块与每个不同尺度不同方向的滤波器做卷积,所得到的滤波图像取均值得到的,与直接利用滤波图像做特征相比,维度更少,提高了计算速度。
  (3)实现了底层特征的编码和空间金字塔池化特征的提取。由于底层特征区分能力弱,特征维数高,所以对提取的底层特征进行编码。首先,使用在线K-Means聚类算法对提取的底层特征进行聚类,形成不同大小码本的词典;然后,在分析现有编码方法的基础上,选择了重构误差比较小的局部线性编码来对底层特征进行编码;之后,利用最大池化,得到图像的最大池化特征;最后,又使用了空间金字塔模型,对图像在不同分辨率下进行划分,提取每个图像块的池化特征,得到具有空间位置信息的编码特征。
  (4)提出基于多特征的融合方法。本文分别采用了前期融合方法和后期融合方法进行实验,前期融合的时候,本文除了对多个特征进行直接串联拼接融合之外,还提出了根据单一特征的识别率确定特征权值的方法进行融合;后期融合的时候,本文的思路是:提取训练集图像三种不同的编码特征,然后分别输入到三个SVM分类器中,分别训练三个SVM分类器,对于待分类的图像,分别把三个特征输入到训练好的分类器中,根据输出的得分和标签综合决策得到结果。通过实验对比,直接串联拼接的融合方法效果更好,所以对比实验采用这种融合方法做了对比实验。
  本文在公开数据集Caltech101上对提出的算法做了两组对比试验,并且与传统的图像分类方法和单一的特征分类方法做了对比实验,验证了本文算法的可行性和准确性。
其他文献
随着卖方市场向买方市场的转变,消费者需求不再是被动的而是主动的,对供应链的更高要求随之出现。供应链的实现,需要联系起由供应商、生产厂家、分销商、零售商组成的链路上的每一个环节,并进行优化,使生产资料迅速地通过生产、销售环节变成价值增值的产品,呈现到消费者面前。因此企业的竞争实力体现在供应链给消费者提供的价值的增加,以及供应链成本的减少。供应链优化问题成为所有企业追求发展与进步所关注的核心内容和重要
学位
随着市场的快速发展和完善,作为资产配置的重要媒介,金融的重要性愈加突显,与此同时,人们对于金融理论的研究也愈加重视。作为金融研究的核心课题之一,投资组合优化问题主要研究如何在不确定情况下对金融资产进行合理配置与选择,从而实现收益率最大化与风险最小化间的均衡。这是所有投资者和投资机构都要面临的问题。然而,以往的研究者主要是假定投资的终止时间是固定的,并没有将投资的时间变动考虑到投资组合优化的范畴,而
钢管切割问题的任务是决策如何将原始钢管进行切割,形成符合合同订货长度的子管,从而满足合同的需求量。在实际生产中,钢管切割是一个两阶段的过程,第一阶段将原始钢管等距切割成为中间管,第二阶段根据合同的具体要求将中间管切割成符合需求的短管,因此钢管切割需要同时决策两个阶段的切割方案。钢管切割计划是钢管生产制造管理过程中的一个必要且重要的环节,对于提高材料利用率和提升企业的利润具有重要意义。  本文以钢管
随着互联网的不断发展,大量的用户在此类产品上都会留下评论以进行交流,这些文本的评论信息具有传播速度快、传播范围广、影响人数多等特点。那么对于这些评论文本信息进行深层次的挖掘无论在商业角度还是社会角度都十分有意义。学术界目前的研究重点是利用深度学习等机器学习技术将文本情感分为正向和负向两类。国内对于情感分析的研究发展比较缓慢,本文深入地研究了中文情感分析的相关技术之后,主要工作如下:  首先,提出了
学位
分数阶微积分在数学领域是一个古老而又年轻的领域,在分数阶微积分概念提出以后的200多年里,研究者们主要侧重于其纯数学领域的研究。随着计算机技术的发展,很多以前不能解决的问题目前已经迎刃而解,客观上为其在工程实践中的应用创造了条件。分数阶微积分能够比整数阶微积分提供更丰富的信息,具有更好的灵活性。分数阶控制系统在原整数阶控制系统上增加了阶次参数,无论用其对系统的建模,还是对系统设计控制器,都可以期望
学位
磁共振成像(MRI)作为一个强大的医疗成像技术具有越来越重要的地位,在当前诊断与临床应用中,它的出现极大地提高了医疗诊断水平。然而脑MR图像存在缺点:如成像模糊和不均匀以及噪声等,而婴幼儿的脑MR图像存在脑内信息不能如实反应病灶信号和强度不能得到客观表达等问题,对婴幼儿脑MR图像进行增强和去噪操作有助于医生的诊断以及后续如脑图像分割等步骤。因此,脑MR图像增强和去噪具有重要意义。本文对婴幼儿脑MR
学位
机器人在环境中根据传感器的数据估计自身位置,并创建环境地图,这一过程称为机器人即时定位与地图构建(SLAM)。它是真正实现自主移动机器人的关键,已成为自主智能机器人领域研究的热点。闭环检测是一个场景识别的问题,也是SLAM系统中的关键环节。对于增加机器人的位姿约束,减少系统累计误差,闭环检测至关重要。传统实现方法采用基于手工特征的词袋模型检测闭环,其局限性在于受光照和环境等影响明显。本文针对上述问
学位
音乐作为人们精神上的一种思想表达开始广泛流行于人们的日常生活,早在东汉时期,许慎在中国的第一部系统的分析汉字的形状及来源的字典《说文解字》中按照是否需要人通过心灵想象创造来指明了声音和音乐之间的关系:“音,声也。生于心,有节于外,谓之音”。音乐受其自身来源特性的影响,和数学、物理存在着强烈的相关性,随着计算机自身计算能力的日渐强大和相关软硬件的研发周期逐渐缩短,计算机与音乐之间的关系也愈加紧密。 
学位
激光雷达作为一种能够实时采集丰富信息的新兴设备,已经在各种领域得到了广泛地应用,因此激光点云数据的处理已然成为国内外研究的热点,而激光点云的分割作为激光点云数据处理的不可或缺的一部分其重要性也是不言而喻。激光点云的分割主要涉及去除激光点云中的噪声点、快速精确地计算激光点云的法线、选择合适的特征和分割方法等多个步骤,每一个环节都对点云分割效果有着重要的作用。并且,法线作为激光点云最重要的属性之一,不
汉字识别隶属于文字识别,文字识别是模式识别领域研究的重要课题之一。汉字识别涉及众多学科,如模式识别、数字图像处理、统计学、自然语言处理、信息论等。手写汉字识别主要包括联机手写汉字识别和脱机手写汉字识别。脱机手写汉字识别可利用信息较少,识别难度较大。  本文主要研究内容包括:  (1)脱机手写汉字特征提取方法。特征提取在脱机手写汉字识别的过程中起到至关重要的作用,好的特征提取方法应该能够很好地应对笔