【摘 要】
:
近几年,卷积神经网络(Convolution Neural Network,CNN)已经成功应用于许多计算机视觉任务,它的核心是通过卷积运算、池化以及非线性运算,使网络能够在每一层的局部感受野内融合空间和通道信息建立高维特征表示。传统CNN通过执行线性组合和逐元素非线性运算,可以从输入图像中提取一阶信息。而二阶统计信息是对局部特征组按通道计算协方差矩阵、Fisher信息矩阵或基于向量外积运算得到特
论文部分内容阅读
近几年,卷积神经网络(Convolution Neural Network,CNN)已经成功应用于许多计算机视觉任务,它的核心是通过卷积运算、池化以及非线性运算,使网络能够在每一层的局部感受野内融合空间和通道信息建立高维特征表示。传统CNN通过执行线性组合和逐元素非线性运算,可以从输入图像中提取一阶信息。而二阶统计信息是对局部特征组按通道计算协方差矩阵、Fisher信息矩阵或基于向量外积运算得到特征的二阶相关性。研究表明,高阶表示法可以有效增强非线性建模的能力,已有的大部分工作考虑在传统任务中引入二阶统计信息,但直接向量化输出二阶信息矩阵会导致全连接层参数规模过大,降低了模型的效率。本文拟将图像中的一阶和二阶信息结合起来,进一步提升卷积神经网络的泛化能力。并且使信息矩阵在最大限度降维的情况下,研究如何充分的利用二阶信息。抓住二阶信息矩阵是对称正定这个特点,在尽可能少丢失信息的情况下,寻找一种分解方式来减少参数。为达到以上目标,我们设计了高效便捷的算法并将其用于一阶信息与二阶信息的网络模型。主要研究贡献分为以下两部分:一、提出了一种利用二阶统计量的新型CNN结构,主要包括信息矩阵计算,引入参数变换以及二阶统计信息分解。这种层结构有着自身的优势:(i)从卷积激活中提取协方差矩阵,在协方差矩阵中加入一阶信息,完成二阶与一阶信息进行非线性运算;(ii)对信息矩阵进行特征值分解,用特征值度量特征通道的重要度;(iii)给出双线性参数矩阵大小的设置公式,以及(iv)对二阶信息矩阵建立了Cholesky-DLT压缩策略(Cholesky Decomposition Log Transformation),通过所提出的矩阵分解方法实现了从黎曼流形结构到欧氏空间的变换,同时减少了参数数量。实验表明,通过加入Cholesky-DLT压缩策略,模型参数量减半的同时,提高了图像分类准确率。二、本文提出一种新型模块称为So Conv-block(Second order Convolution block),利用多层一维卷积与二阶统计量进行建模,有效提取高阶统计量进行特征表示,能够展示建模特征与远距离特征之间的直接依赖关系。加入So Conv-block模块还可以利用注意力机制学习特征的偏好程度,显示建模特征的重要程度。这种新型模块可以很方便的整合到端对端网络结构中,很好地应用在任意一阶网络模型,通过加入少量的参数来提高图像的分类精度。
其他文献
简帛书是先秦至魏晋时期古人以简牍和缣帛为载体所书写的墨迹。简帛书法自19世纪末一经发现就备受学界关注,而简帛书法资料的日渐丰富又进一步推动了人们对简帛书法的认识。简帛隶书是最真实的隶书真迹,是碑刻铭文书法无法代替的古人墨迹,因此简帛书法对当代隶书创作和研究是不可或缺的重要内容。简帛书法对当代隶书创作产生了重要的影响,但目前对这方面的研究并不充分。本文首先对秦汉时期简帛的使用情况和当下的简帛实物的发
自改革开放以来,我国经济发展进入新时代,正大步向高质量发展的新阶段迈进。2013年5月初,中共河北省委第八届五次全会提出只有实现“无中生有”的目标来发展战略性新兴产业,提高“有中生新”的速度来优化传统产业,才能符合新阶段的任务与要求,实现河北省经济的高质量发展。因此,对河北省战略性新兴产业与传统产业进行评价指标体系的构造,深入探讨两类产业间的协调发展状况及影响因素,不仅能够为正确处理好两类产业的关
本文旨在调查阅读推广活动中的读者从众行为特点,厘清读者从众行为对活动参与意愿的影响效果,为公共图书馆阅读推广活动设计、宣传提供参考。研究基于从众理论和阅读推广活动实践案例推演得出读者从众行为模型,以多个省份、城市公共图书馆为样本基地,在馆长和馆员的帮助下,对参加阅读推广活动的读者开展线上和线下问卷调查。问卷以读者从众行为模型为框架,共包括社会人口学资料统计和从众行为调查两部分。应用SPSS21.0
在当今计算机网络时代,微博、淘宝、京东等应用平台给人们的生活带来了很大的便利,与此同时,大量的评论与观点由此而生。用户的评论与观点代表着用户的情感倾向。掌握用户的情感倾向,就可以有效地为用户推荐或规避某些话题或者商品。如何从这些内容中把重要的情感信息挖掘出来显得尤为重要。本文针对文本的情感分析任务,提出了一种情感分析残差网络模型,该模型充分利用了相似文本之间的特征关联性,在情感分析任务上取得了良好
伴随着系统仿真和控制芯片性能的日趋发展,对于现在的控制需求来说仅仅依靠纯数学仿真显得力不从心。由此而来的半实物仿真技术逐渐得到了普及,因它兼具纯数学仿真和物理试验的特性,所以在工业界得到了广泛的应用。本文通过对半实物仿真技术进行分析与研究,结合学校中的实际情况,在保证性能的前提下,控制设计成本,搭建了基于STM32与MATLAB/Simulink的半实物仿真平台,满足了教学与科研中的需求。为了验证
传统的单类支持向量机(one-class support vector machine,OCSVM)在非监督学习领域中取得了较优的性能,从而得到了越来越多的关注。然而,OCSVM存在以下不足之处:一、OCSVM的分类性能在很大程度上依赖于核函数及其参数的选取,若选取不当,则OCSVM就会取得较差的分类效果,而对OCSVM的核函数及其参数的选取迄今仍无可靠的理论依据;二、OCSVM对训练集中的噪声非
极限学习机(Extreme Learning Machine,ELM)具有学习速度快和泛化性能较强的优点,它被广泛应用于分类问题的研究中。由于连接权重的随机初始化,ELM的网络输出往往不够稳定。与ELM相同,单类极限学习机(One-Class ELM,OCELM)同样具有输出稳定性较差的缺点。由于能够加强模型的稳定性和泛化性能,集成学习一直被认为是机器学习领域中一个重要的研究分支。为了提高OCEL
缔合流体是一种具有特殊结构和性质的流体,通过对缔合流体物理化学性质的研究,将会为未来科学的发展和工业的进步提供有价值的见解。因为缔合流体在生物化学、物理化学及材料化学的研究中扮演着重要角色。本文以Aa型缔合流体为研究对象,在具体研究中,首先基于统计力学原理,结合经典流体密度泛函理论,构建体系的巨势泛函,并根据巨势泛函极小化原理计算流体的平衡密度分布,进而得到径向分布函数,并进一步结合Kirkwoo
衡量航空发动机性能优劣的一个核心指标是其推力大小,而转子的转速与发动机推力紧密相关。转子转速调节的快速性和动态精度是衡量航空发动机调速性能的主要性能指标,响应快的调速系统能增加飞机飞行的机动性,但往往伴随着较大的速度超调。转速超调不仅会增加燃油消耗,更可能会导致转子叶片的抖动甚至引发喘振。因此,除了满足对发动机的性能要求外,其安全保护问题同样重要,研究航空发动机调速控制的无超调动态响应,兼顾调速系
生成对抗网络是一种新型的深度生成模型,具有可以拟合任意复杂数据分布的超强建模能力,尤其在图像生成任务中展现了出色的性能,故一经提出就迅速在深度学习领域占领了主流地位。然而,生成对抗网络模型在集图像清晰、简单高效等众多优点于一身的同时也存在着不足之处,模式崩溃就是其面临的主要挑战之一。模式崩溃是指生成器生成的数据样本之间具有较高的相似性,即生成的数据样本集中分布在目标分布的部分模式上,多样性较差。模