基于BoF结合卷积神经网络的图像分类方法研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户：collinne

【摘要】

：

图像分类是计算机视觉领域的热门研究方向,也是人工智能发展的重要基础。随着智能化移动端的快速普及,推动了全球移动数据流量的大幅度增长,与此同时计算机性能的不断提升,尤

【作者】

：

杨东旭

【出处】

：

新疆大学

【发表日期】

：

2004年期

【关键词】

：

图像分类卷积神经网络 Softmax 迁移学习 BoF

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像分类是计算机视觉领域的热门研究方向,也是人工智能发展的重要基础。随着智能化移动端的快速普及,推动了全球移动数据流量的大幅度增长,与此同时计算机性能的不断提升,尤其是在GPU平台上的高性能计算,使图像分类任务的研究从传统方法渐渐转向基于大数据的深度学习方法。图像分类一般由特征提取、图像表征、构建分类器这三个主要部分组成。在图像分类任务中,如何选取最具代表性的特征对系统分类性能起着至关重要的作用,传统方法一般是由人工设计一个或多个特征相结合,然后对其调优后使用分类器进行图像分类,然而这种方法消耗了大量的时间和人力,并且很难达到很好的效果。通过研究者的不断探究发现,使用深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)可以从海量数据中自主学习到多层次的图像特征,并使分类精度达到了与人类接近的水平。因此,基于深度学习方法的研究成为了当下处理图像分类问题的主要方法。本文通过对DCNN进行图像分类的整体过程进行研究,发现存在的一些问题,并对其进行改进,主要工作内容如下:第一,针对传统DCNN模型中Softmax分类器存在的过早饱和及模型参数采用随机初始化训练时间长、识别准确率低的问题,提出一种将噪声注入Softmax并结合迁移学习的图像分类方法。首先,根据对Softmax饱和问题进行探究,对比注入的噪声参数选取对识别率的影响来找到最佳情况,从而产生更为宽泛的梯度并起到延迟饱和的作用;然后,利用公开预训练模型参数来代替随机初始化参数,并比较冻结不同卷积层对模型的影响;最后,在数据集上实验,证明所提方法具有良好的识别效果。第二,针对DCNN模型越大,使用的参数数量越来越多,和只能处理固定尺寸的图像。提出一种特征袋(Bag of Feature,BoF)结合DCNN的图像分类方法,称为卷积特征袋(Bag of Convolutional Feature,BoCF),它通过构建一个量化神经层对DCNN提取到的特征进行有效量化来减少参数数量,该方法可以与各种特征提取器和分类器组合形成高效的图像表征和识别系统。同时允许网络模型使用常规的反向传播算法进行优化迭代。所提方法能够降低网络参数,并实验证明了该方法的有效性。

其他文献

基于机器视觉的PCB缺陷检测算法研究

近年来,PCB行业取得了飞速发展。PCB向着小型化、多线路和高精度的方向不断开发,PCB的质量问题开始成为关注的热点。传统的检测手段不能满足PCB的发展需求,随着图像处理和机

学位

PCB图像去噪Harris角点图像配准缺陷检测

血清PDGF-BB/PDGFR-β配体受体及MCP-1、MMP-9水平与冠心病血瘀证的相关性研究

目的:本研究采用酶联免疫吸附法检测冠心病血瘀证患者外周静脉血血清血小板衍生生长因子-BB(PDGF-BB)、血小板衍生生长因子受体-β(PDGFR-β)、单核细胞趋化因子-1(MCP-1)、基质金属蛋白酶-9(MMP-9)表达水平,采用RT-PCR技术检测冠心病血瘀证患者外周静脉血单核细胞中的PDGFR-β mRNA表达水平。并通过分析比较上述指标在冠心病患者与健康人群之间表达水平的差异性,进而探

学位

冠心病血瘀证血小板衍生生长因子-BB血小板衍生生长因子受体-β单核细胞趋化因子-1基质金属蛋白酶-9PDGFR-βmRNA

实时传输的可有噪声的人脸识别

随着近几年人工智能和大数据的技术的飞速发展,人脸识别技术也随之成为一个热门的话题。而在人脸识别技术中,最有挑战性的课题就是实时传输人脸识别。因为实时传输人脸识别在

学位

人脸识别背景减除稀疏矩阵照明字典

民国时期蒙古文报刊研究（1932-1945）

1932-1945年的岁月对于中国的蒙古地区来说是一个被侵略被殖民的年代,同时也是一个启蒙和反抗压迫并存的年代。这一时期的蒙古文报刊虽然是各方面的政治势力所控制的宣传工具

学位

民国蒙古文报刊传播特点

基于意见挖掘与深度学习的推荐算法研究

在信息迅猛增长的今天,推荐系统在缓解信息过载方面发挥着关键作用。众所周知,推荐系统基于用户的历史行为数据,利用自身的算法逻辑,筛选并匹配出用户偏好的项目。目前推荐系

学位

推荐系统意见挖掘神经网络用户评论矩阵分解

基于混沌不透明表达式的代码混淆技术研究

代码混淆技术作为一类重要的软件保护技术,能够有效防止他人剽窃软件中的智力成果,因此在软件保护领域得到广泛应用。代码混淆技术起源于对JAVA字节码的保护,后来经过人们的

学位

代码混淆混沌不透明表达式混沌映射二次映射混沌不透明谓词

面向不确定数据流环境的频繁模式挖掘算法的研究与实现

频繁项集挖掘是数据挖掘领域的一项重要工作,它是关联规则挖掘、聚类、分类的基础。随着信息技术的迅速发展,众多应用领域实时、持续、快速地产生大量的数据流。数据流由于自

学位

数据挖掘频繁项集不确定数据流Top-K频繁项集滑动窗口

基于麦克风阵列的钢琴声场逼近研究

随着物质生活的提升,人们对精神生活的需求不断增加,钢琴作为乐器王者逐渐受到青睐,同时钢琴需要灵活运用左右手,也符合中老年人健身健脑的需求。但是钢琴庞大的机身,高昂的

学位

钢琴音色评价声场逼近特征提取BP神经网络

基于分布式节点发送顺序和时间联合优化的水声网络MAC协议研究

随着水声通信技术的不断发展,水声通信从原来的军事领域发展到了多个民用领域。因此,为了组建高性能水声通信网络,除了要解决点到点的两个用户之间可靠通信之外,更需要解决多

学位

水声网络多节点MAC协议分布式发送顺序和时间联合优化

液滴机械手的微操作方法研究与实现

随着微机电机械系统MEMS的发展,元器件也逐渐趋向小型化、薄型化发展趋势,对微操作技术提出了越来越更高的要求。微小物体的拾取、姿态调整和释放是微操作中的重要环节,由于

学位

液滴机械手微操作微小物体姿态控制释放

基于BoF结合卷积神经网络的图像分类方法研究

与本文相关的学术论文