基于显著视觉字典编码的多特征图像分类方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:hudaxia110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统空间金字塔词袋模型未充分利用视觉字典结构信息,导致用于特征编码的视觉字典缺乏显著性和判别力,在特征编码时不同局部特征由相同近邻单词表示,生成完全相同的编码系数向量,产生较大量化误差;在提取特征时,将图像目标区域和背景视为同等重要,导致图像背景信息干扰,同时未充分考虑图像的RGB三通道分量和细节信息,导致图像信息缺失,该模型图像分类性能有待提升。本文从视觉字典编码和提取图像特征方面进行改进,提出基于显著视觉字典编码的多特征图像分类方法。本文的主要研究如下:针对空间金字塔词袋模型未充分利用视觉字典结构信息,本文提出生成显著视觉字典方法,在K-means聚类生成视觉字典后,计算单词的相似性和显著性,生成有判别力的视觉字典;针对特征编码时不同局部特征生成完全相同的编码系数向量问题,提出加权局部约束线性编码方法,根据特征与近邻单词之间的位置关系为近邻单词设置权重,生成更加精准的编码系数向量;上述方法结合提出基于显著视觉字典编码方法,一方面充分利用字典显著信息,另一方面减小量化误差,提升模型的图像分类性能。针对提取特征时存在图像背景信息干扰,本文提出图像显著区域特征,首先采用FT显著性检测方法提取图像显著区域,然后利用Gabor滤波提取显著区域纹理特征,生成显著区域特征;针对特征提取时未考虑图像的RGB三通道分量和细节信息,本文提出RGB三通道特征,首先将图像分解为R、G、B三个通道,然后分别对三个通道图像进行字典学习和特征编码,最后将编码后的向量表示进行融合生成最终的RGB三通道特征。将显著视觉字典编码生成的直方图特征与显著区域特征、RGB三通道特征进行融合,得到本文基于显著视觉字典编码的多特征图像分类方法。本文在MSRC、Caltech101、15Scene数据集上展开实验,实验结果显示了本文提出的生成显著视觉字典、加权局部约束线性编码、显著区域特征、RGB三通道特征对分类准确率的改进情况,表明了本文对视觉字典编码与图像特征提取方面的优化是可行的。
其他文献
正交频分复用(OFDM)系统是无线通信网络中一种常用的多载波调制技术,具有频谱利用率高,抗多径干扰的特性。OFDM信号是由多个子载波叠加形成的,当各个子载波的幅值相近或者相等时,就会产生瞬时峰值信号,进而导致较高的峰值平均功率比(PAPR)问题。高峰均比的信号极易进入功率放大器等有源器件的非线性工作范围,导致信号出现失真,影响系统的传输性能。部分传输序列(PTS)是一种降低OFDM系统峰均比的方法
学位
旨在探究不同添加水平包被复合微量元素对黄羽肉鸡血清生化指标、抗氧化和免疫能力的影响,并确定适宜添加水平。试验选取1日龄体质量为(32.61±0.60) g、健康状况良好的雄性黄羽肉鸡300只,随机分为5个处理组(A、B、C、D、E组),每组6个重复,每个重复10只鸡。处理组A、B、C、D、E组分别在基础饲粮中添加200,400,600,800,1 000 mg/kg包被复合微量元素。试验分为1~2
期刊
四旋翼无人机姿态解算及姿态控制是其导航中基础问题之一,随着微机电系统(Micro-Electro-Mechanical System,MEMS)技术的发展,MEMS惯性传感器成本越来越低,精度越来越高,性能越来越强,极大地促进了四旋翼无人机的发展。又因为四旋翼飞行器可以在空中灵活运动亦可悬停,引发众多学者的广泛研究,也取得了显著的成果,四旋翼无人机已经涉及人们的日常生活,如航拍摄影、快递运输、农药
学位
在木门加工生产线上针对大跨距龙门机器人对不同尺寸板材分拣的需求,本文基于计算机视觉技术对大跨距龙门机器人智能分拣及定位方法进行了研究。主要内容如下:首先,设计并构建了基于Clinet/Server架构的龙门机器人智能分拣系统。该系统基于服务器端与客户端架构,通过虚拟仿真系统、实验室仿真平台和工厂真实大跨距龙门机器人平台,实现了由虚拟到真实的分层开发。并构建了虚拟数据集、实验数据集和真实数据集,为在
学位
随着汽车数量的逐渐增加,智能交通的发展成为缓解道路拥堵、减少交通事故、降低环境污染的一种途径,其中车辆队列控制能够提升公路系统运行效率以及安全性。但是车辆在行驶过程中会遭受到风速,参数不确定性,空气阻力等扰动的影响,以及受限于车辆本身的物理特性,执行器和传感器等器件在工程实际应用时不可避免会因老化,损坏等问题产生故障,上述因素给车辆队列控制带来了一定的挑战。因此,根据车辆队列遭受到的不同外界条件,
学位
准确的电力负荷预测对于电力系统的安全经济运行具有重要意义。在传统的电力负荷预测研究中,研究者们通常考虑气温、湿度、假期等因素对电力负荷的影响,并未考虑搜索引擎指数和COVID-19疫情因素,而这2个因素在当前情况下同样与电力负荷具有相关性,搜索引擎指数与电力负荷的相关性在人流量大的旅游区域表现得更为明显,而COVID-19疫情在2020年后成为了新出现的对电力负荷有影响的因素。本文提出了考虑搜索引
学位
专利是授予发明者在一定时期内保护其发明的法定权利,在当今的人工创新中发挥着重要作用。现有的研究工作并没有针对专利相似度数据进行适配优化,导致其应用在专利短语相似度匹配任务上效果不佳。先前的研究表明,在低资源的场景下,提示学习将文本片段(即模板)插入到输入中,将分类问题转换为掩码语言建模问题,其关键的一步是在标签空间和标签词空间之间构造一个投影。本文提出一种基于知识注入的提示学习方法,将其应用于专利
期刊
<正>俄罗斯克麦罗沃心血管疾病综合问题科研所专家们在制造小口径人造心血管道路上迈出了新的步伐,相关血管植入生命机体后可减少形成血栓的风险。研究人员已能展示他们所制造的人造血管在大型实验室动物体上的相对效果。人工合成血管与血液和周围组织相互作用并在植入后很快会形成一层血栓,对患者的血液和生命构成威胁。因此制造一种可产生最小量血栓的人造血管成为一个研究方向。据悉,研究人员给35只绵羊的颈动脉里植入了人
会议
随着人工智能科技的蓬勃发展,声纹识别逐步受到人们的重视。声纹识别作为生物识别技术的一种,有着很高的商用价值,例如在智能终端、语音助手、人机交互与信息安全等民用及军用领域都发挥着重要的作用。本文分析了深度学习方法在声纹识别领域表现优异的原因,认为在特征提取与融合、损失函数等方面可以做出改进,对改进算法的声纹辨识准确度和模型鲁棒性进行了探讨。本文重点工作和算法创新点如下。首先,因为基于深度学习的声纹识
学位
优化问题广泛存在于工程和科学领域中,其目标是在满足相关限制条件下选择合适的变量,取得目标函数最优值。相较于传统优化算法在求解优化问题时需要函数可导和求解结果依赖于初始值等问题,近年来提出的元启发式算法对目标问题限制少,目标函数可以是可微的或不可微的、连续的或不连续的、有约束或无约束的、凸的或非凸的。帝国主义竞争算法(Imperialist Competitive Algorithm,ICA)是受帝
学位