基于CSPPNet与集成学习的细粒度图像分类

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:mqz614005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的图像识别需要人工操作提取特征,成本高,且有些图像特征是根据特定的场景设计的,不具有普适性。随着深度学习的发展,卷积神经网络作为其分支,有效避免了人工设计和提取特征,在图像识别领域获得了广泛的应用。然而粗粒度的图像分类无法满足人们对图像的了解更深层次的需求,细粒度图像分类方法应运而生。细粒度图像分类任务要求对图像细节进行辨认,即使人类也难以在如此小的类间差异和大的类内差异中区分数百个下属。加之同一类中图像背景复杂,不同的姿势、角度和照明条件使任务变得更具挑战性。搭建合适的卷积神经网络结构能够实现端对端的细粒度图像分类任务。
  本文介绍了卷积神经网络以及双线性卷积神经网络的基本理论。在CUB-200-1011鸟类数据集和Stanford Cars汽车数据集上验证双线性卷积神经网络对于单标签细粒度图像的分类效果,通过调整网络层次结构、归一化方法、输入图像数据大小对分类任务进行优化,实验表明减少图像剪裁可以提高准确率。
  针对更为复杂的细粒度图像数据,如多标签、数据不平衡,双线性网络并不适用,本文改动训练集采样方法,搭建了一个“粗细结合”的深度网络。此网络结合空间金字塔池化和特征融合的优势,将模型不同层的卷积生成的特征图通过空间金字塔池化层融合,能够同时利用图片的整体特征和局部特征,自动检测差异,对细粒度图像分类问题有较大的提升。
  利用集成学习的方法进一步优化网络模型,提升分类准确率。本文最终建立的粗细结合的模型在人类蛋白图谱数据集上进行了验证,与经典卷积神经网络相比较,训练的精度与F1得分均有提升。
其他文献
作为世界上最大的发展中国家,改革开放四十年以来,中国经济发展取得了举世瞩目的成就,工业化和新型城镇化进程日益加快。与此同时,资源消费日益加大,资源需求压力巨大。资源的安全已经成为事关中国全局性的重大战略问题。然而,在中国资源型地区,经济发展往往比较缓慢并有下降的趋势。虽然中国资源储备较为丰富,但却并未将资源优势转变为经济发展优势。资源开发与生态环境问题,往上追溯都是经济发展模式问题——即对物质资源
日新月异的互联网使得文本类数据与日俱增,过载的文本信息增加了检索、归类等任务的难度。传统的文本分类已难满足人类的需求,自动文本分类技术弥补了传统文本分类的不足,其能够自动完成文本分类任务,使得信息检索、分类等任务变得更加简洁高效。  机器学习作为一种数据挖掘技术,能够从大量数据中通过学习而获得人们所需要的信息。朴素贝叶斯算法作为机器学习中一种重要的分类技术,因结构简单、理论扎实及高效准确的特点,被
学位
随着遥感成像技术和计算机硬件的迅猛发展,产生了大量的高分辨率遥感图像。遥感图像已在多个领域广泛应用,从遥感图像检测城市建筑是目前的研究重点之一。由于城市是高密度建筑区域,即在较小范围内有大量结构相似的建筑紧密分布,经典的神经网络和分割算法很难在该场景中准确检测建筑实例。为了解决城市密集场景中的建筑实例分割问题,本文基于传统的分割算法和边缘检测的神经网络,提出了一种强化边界精度的建筑检测新方案。该方
学位
肿瘤治疗因其治愈率低,破坏性强,成为医学界难以攻克的课题。肿瘤细胞的生长演化机制与内在生长规律以及肿瘤细胞的生存性分析特征都为肿瘤治疗提供了强有力的理论支撑。值得指出的是随机微分方程领域的理论研究对肿瘤治疗的临床实践产生重要影响。为更好的研究探讨免疫监视条件下肿瘤演化机制与肿瘤治疗的新思路,本文基于随机微分方程理论和肿瘤免疫模型,系统研究了环境波动,周期治疗方法和随机切换对肿瘤细胞的生存性分析特征
在机器学习的许多领域中,都有高维数据存在,通过挖掘高维数据的结构来找到数据的紧表示对于以最小的存储空间来理解数据是非常关键的。近年来的研究表明,许多高维数据被看作是来自于多个低维线性子空间的并集的样本。本文研究了子空间聚类算法,提出了基于块对角表示的改进子空间聚类算法(New Subspace Clustering by Block Diagonal Representation,NBDR)并且在
对机器学习方法中分类模型的有关分类变量的研究,现有的研究大多集中在变量选择上。作为高维统计建模的基础,变量选择在大规模高维度数据处理问题上的重要性和必要性毋庸置疑。然而,针对低维数据,当可用于分析的变量总数并不多时,变量选择可能会导致关于总体分类有效信息的缺失,从而影响分类精度。同时,现有的二分类机器学习算法通常都会假定各分类变量对类别变量具有完全相同的影响,即在不考虑分类变量对类别变量可能存在不
在超高维数据的交互作用研究中,现存的方法都基于预先假定的特定模型进行筛选,而实际应用效果取决于真实模型与假设模型的相似度,当真实模型偏离假设模型时,可能会导致错误的选择结果。本文将主效应筛选中的无模型方法扩展到交互模型中,提出新的无模型交互作用筛选方法。本论文的主要内容和结论如下:  (1)提出了两种基于距离相关的无模型交互作用筛选方法ISDC-T与ISDC-B,这两种方法不要求层次模型假设,适用
在数字经济时代,越来越多的企业认识到数据的价值,越来越多运营过程中的数据被采集,并被进一步加以利用,帮助决策者进行企业运营状况评价和未来风险预警。其中,利用企业当前的一系列经济指标进行一段时间后的破产预测具有重要的意义。本文以此为背景,提出了针对高不平衡度、高维度、高相关性数据分类问题的方法——随机集成秩次k近邻算法(Random ensemble rank k-nearest neighbor
在统计学中,多借助零膨胀模型研究零膨胀数据潜在的模型结构及变量选择问题。然而,在多数情况下,响应变量的非零部分为定量数据,简单的零膨胀模型无法刻画这类数据的模型结构,对应的参数估计方法也不再适用。鉴于此,学者提出处理零膨胀半连续数据的两部模型。本文将惩罚函数的极大似然估计方法引入两部模型,研究其变量选择问题。本文的主要内容及结论如下:  1.阐明了基于惩罚函数极大似然估计方法的两部模型的原理,借助
神经元是神经系统内活动的基本单位,对神经系统信息处理和传递有着至关重要的作用。噪声是神经系统中最大的随机因素,当神经元受到周围噪声的影响后,神经元的放电模式也会发生变化。目前,有大量关于噪声诱导的随机共振和相干共振的研究,本文研究的是与前者不同的噪声对神经元放电的抑制效果,也就是反随机共振。基于Hodgkin-Huxley(HH)神经元模型,深入研究了噪声及自突触对神经元和神经网络放电活动的影响,