【摘 要】
:
如今,卷积神经网络已成为深度学习中的主流模型之一,它在计算机视觉、自然语言处理等任务中具有显著的性能表现。卷积神经网络具有平移等变性,即对输入的平移等效于对输出的平移。然而,对于其他非平移变换,如旋转、放缩,卷积神经网络并不具有等变性。为了解决上述问题,群等变性卷积神经网络由此提出。此外,为了处理非欧几里得空间(如球面)中的图像数据,人们提出了适用于球面流形的球面等变性卷积神经网络。然而,现有的等
论文部分内容阅读
如今,卷积神经网络已成为深度学习中的主流模型之一,它在计算机视觉、自然语言处理等任务中具有显著的性能表现。卷积神经网络具有平移等变性,即对输入的平移等效于对输出的平移。然而,对于其他非平移变换,如旋转、放缩,卷积神经网络并不具有等变性。为了解决上述问题,群等变性卷积神经网络由此提出。此外,为了处理非欧几里得空间(如球面)中的图像数据,人们提出了适用于球面流形的球面等变性卷积神经网络。然而,现有的等变性卷积神经网络更多关注对旋转等变性的研究,而鲜有对放缩等变性以及基于放缩与旋转的复合等变性的研究。此外,现有的球面等变性卷积神经网络,更多的关注全局等变性的研究,而对局部等变性的研究仍处于萌芽状态。因此,本文着重对平面图像域和球面图像域中的基于放缩与旋转的复合等变性卷积神经网络进行研究。同时,对相应的球面等变性卷积神经网络的局部等变性进行研究。对平面图像域的中复合等变性卷积神经网络SRCNN,文章提出复合等变性卷积块,它可以提取相应的复合等变性特征。首先构建了放缩平移群,并在此基础上设计了两类放缩等变性卷积和。其中,是基于放缩平移群的放缩等变性卷积,是基于二维埃尔米特多项式的放缩等变性卷积。接着,基于旋转变换以及放缩变换对于特征图的影响方向不同,根据组合方式的不同,设计了两类不同的复合等变性卷积块——放缩-旋转等变性卷积块和旋转-放缩等变性卷积块。通过详实的实验,我们证明了模型在采用时,模型SRCNN的兼容性和性能更加均衡。对球面图像域中的复合等变性卷积神经网络SRSCNN,文章提出了复合等变性卷积,它对旋转与放缩的复合变换具有局部等变性。首先利用正二十面体的递归划分,得到了一个均匀采样的球面网格。接着,引入了规范等变性卷积神经网络的设计方法,对球面网格进行划分得到对应的图册,并通过球面网格以及图册设计了一个具有复合等变性的、形状为正六边形的卷积。此外,为了利用现有的深度学习框架,我们将正六边形卷积转换为正方形卷积,同时,将图册中图的斜坐标转换为笛卡尔坐标系。最后,通过对比实验表明,模型SRSCNN具有优秀的性能表现。
其他文献
路径规划一直是热门的话题和研究方向,如何及时捕获和提前预测车辆行驶时间的动态变化是解决路径规划的难点及重点,本文提出的算法能够在保证计算速度的同时,提高路径规划的准确度。本文从以下几个方向研究路径规划问题:如何最小化路径行驶时间的均值和标准偏差的(加权)线性组合来解决可靠最短路。在合理假设基础交通网络的行驶时间遵循多元高斯分布的情况下,提出了一种高斯过程路径规划(GP3)算法来计算先验最优路径作为
三维点云语义分割是将点云中的每个点按照各自的类别进行语义的划分,对同一类别的点进行相同的标注。随着三维数据获取的难度变小,基于三维数据的技术开始逐渐发展,也已经开始应用在自动驾驶、智能机器人、遥感和医疗等领域中。点云语义分割算法是三维点云处理的重要方向之一,传统的点云分割方法精度不高,因此,本论文主要研究的内容为基于深度学习的三维点云语义分割,使用的基础网络为PointNet++,并对其从局部空间
回复式神经网络(Recurrent Neural Networks,RNNs)是深度学习领域中的一种基础的人工神经网络,其作为处理序列数据的记忆模型被广泛应用。如何处理好梯度消失与梯度爆炸问题一直是训练RNN的关键和难点。长久以来,人们提出了多种方法来解决RNN训练时的梯度问题,不断设计新的RNN变体用以处理更长的序列。尽管许多经典的模型已经被提出,如何使RNN模型在快速应对序列中短期变化的同时捕
计算机视觉发展过程中,人体姿态估计任务一直备受关注。在工业界和学术界,姿态估计任务也是极具挑战性的任务之一,目标是使机器尽可能的检测出人体样本中关键节点,比如鼻子、左右肩、脚踝、手腕。随着深度神经网络的引入和应用,人体姿态估计任务往往是预测人类行为规律的基础研究任务,为行人检测、样本重识别、特殊行为检测、人机交互等任务提供了基础预测能力。当前主流的人体姿态估计网络框架分为两种应用型网络,即人体结构
在工业产品的生产过程中,通常会无法避免地产生一些表面缺陷,因此需要检测出产品的表面缺陷以便及时发现问题并且对产品质量加以控制。与人工检测方式相比,基于计算机视觉的工业表面缺陷检测方法,具有成本低、安全性好、效率高、灵活性好等诸多优势,已成为自动化缺陷检测系统的重点研究方向之一。针对工业生产中产品的表面缺陷检测问题,本文设计了一种基于计算机视觉的深度学习平台,在表面纹理较规律的缺陷检测任务中取得了很
近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过
光纤通信向着高速率、大容量、远距离传输的目标发展,由于光纤损耗,需要使用光学放大,为增加传输距离,必须相应地使用越来越多的光放大器。光放大器也使噪声放大,为保持较高的信噪比,信号光功率需要增大。然而,当光信号功率超过一定值时,光纤内的非线性会增强,产生非线性干扰噪声。在长距离、高激光发射功率的光通信系统中,光纤中累积的非线性效应成为影响系统通信性能的主要因素,信号由于受到非线性而产生畸变,使得通信
推荐系统被广泛应用于互联网的各个领域中,用来解决当前时代信息过载的问题。它不仅可以帮助用户快速筛选出感兴趣的内容,也为互联网公司创造出了巨大的商业价值。针对用户进行分析是个性化推荐系统的基础和前置工作。基于对某个用户的分析可以发现这个用户对不同物品感兴趣的程度。用户、物品和其他一些附属信息,比如标签信息、物品种类,共同组成了一个异构的信息网络。一般情况下,推荐算法会直接把用户描述为显式或隐式的评分
不断发展的传感、计算和通信技术驱动着信息物理系统和物联网深入到了社会的各个领域,如智能工业过程、智能电网和智能交通等。在工业控制领域,传统的基于可编程逻辑控制器或微控制器的控制系统面临着计算能力较弱、交互能力较差等问题,而随着边缘计算模式的出现和应用,为工业控制系统中智能和复杂控制方法如基于迭代的最优和鲁棒控制方法、模型预测控制等的应用提供了新的思路。本文以工业温度场控制为场景,尝试将边缘计算与控
如今,机器学习已经成功地应用于信息检索、数据挖掘以及计算机语音识别等多个领域。但是,由于其功能和工作机制上的复杂性,实际应用与学习中大多数用户将机器学习模型视为黑匣子,且高性能模型的开发需要耗时的、反复的试验过程。所以,对机器学习的可解释性进行研究探索是一个很重要的命题。学术研究人员需要更加透明和可解释的系统,以更好地理解和分析机器学习模型。可视化分析是将数据转换成富有信息的视图的新兴技术,它利用