深度神经网络的轻量化卷积算子与自适应激活函数研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:gogl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术在计算机视觉、语音识别、自然语言处理等多个领域崭露头角并取得了巨大成功。该技术主要基于神经网络模型,采用“端对端”的特征学习方法,通过多层处理找到数据中隐藏的非线性特征,进而能够从大量训练集中自动学习以掌握全局特征。然而,基于神经网络模型的深度学习技术目前还存在计算复杂度大和表达能力有限等问题。针对上述问题,本文从轻量化卷积算子和自适应激活函数这两个角度进行了研究:第一,提出了一种深度神经网络的轻量化卷积算子。卷积神经网络由于特征图与卷积核之间的密集连接模式而存在大量计算冗余。现有的工作致力于构造特征图通道间的稀疏映射关系,无法很好的兼顾特征图在通道内的稀疏映射关系。为此,本文研究了特征图在通道内稀疏映射关系,并提出了一种名为“梳状卷积”的轻量化卷积算子(CombConvolution Operator,CombConv),旨在大幅降低卷积操作所需的时间复杂度。所提出的CombConv通过将线性映射并行、交错地插入到标准卷积映射中,将原有卷积操作的运算复杂度降为原来的一半。CombConv能够直接替换网络中的卷积操作,并进行端到端训练。在实验中,本文将使用CombConv前后的网络模型在图像分类任务上进行了对比。在多种数据集和多种模型上的实验结果表明,所提出的轻量化卷积算子CombConv能够在获得相当的分类效果的前提下,有效降低模型的运算复杂度。此外,CombConv致力于解决特征图层内计算冗余的问题,与减少层间计算冗余的方法兼容,因此可以将CombConv整合到现有的先进模型中,以进一步提升网络模型的效率。第二,提出了一种深度神经网络的自适应激活函数。现有的激活函数普遍存在均值非零、负值缺失和无界输出的问题,限制了神经网络的表达能力和收敛速度。本文研究了多种常见激活函数的特点,并提出了一种名为“平滑根号”的自适应激活函数(Soft-Root-Sign Activation Function,SRS)来同时克服以上三个问题。通过自适应地调整一对独立可学习参数,所提出的SRS能够捕捉更多有用信息并提供接近零的均值输出,从而提升网络泛化性能并加速网络收敛。同时,SRS作为有界激活函数,能够将任意大小的输入压缩到相同的范围内,因此确保了网络在训练过程中产生更稳定的分布。在实验中,本文将所提出的SRS激活函数与其他激活函数在图像分类、机器翻译以及密度估计三项任务中进行了对比。结果表明,所提出的SRS激活函数具有更强大的表现性能和更快的收敛速度。
其他文献
<正>新加坡国立大学医学院的研究人员收集了663名居住在新加坡的60岁以上老人的数据,研究人员对他们进行了随访,护士测量他们的血压、体重、身高、握力、步行速度等指标,并调取了他们的人口统计信息。此外,这些老人还在电脑上完成了测量认知、抑郁和焦虑的量表。最后,研究人员对他们进行了神经心理学评估,作出痴呆症评定。研究人员把这些测试的总体结果与精神病学专家进行了深入讨论,并形成诊断共识。同时,研究团队还
期刊
变电站巡检机器人的一项重要任务是从采集到的仪表图像中“读取”出关键设备运行状况的真实数值。由于机器人的实际作业环境状况,如雨天、雾天等会对仪表图像的成像质量造成影响,从而限制了仪表读数的精准度。雾浓度与图像采集距离被认为是影响仪表读数准确性的两个重要环境因素。到目前为止,尚没有较好的雾与距离综合评价方法和仪表区域去雾算法。无法对采集环境进行精准感知会降低读数结果的可靠性,而缺乏有效的去雾算法会导致
学位
近年来对能源短缺和环境污染问题的不断研究与探索,驱动着分布式发电系统的不断发展。作为交直流转换接口的并网逆变器大量接入电网,成为影响系统工作效率和工作稳定性的重要因素。由于逆变器的电力电子化程度较高,网侧电气量的波动对其正常工作有比较大的影响,加之对自身参数摄动较为敏感,使得逆变器对其控制策略的抗扰能力要求较高。为解决上述问题,本文提出了一种具有良好鲁棒性的新型锁相环结构,能在网侧电压发生波动时输
学位
水声传感器网络(UASNs)作为无线传感器网络(WSNs)在水下的延伸,目前已在海洋环境监测、海啸灾害预警、水下资源勘探、海上战争等领域得到广泛应用。作为水声传感器网络的基础研究,节点部署和节点定位是水下路由设计、拓扑控制等其余研究的先行工作。受水下环境以及水声信道特性的影响,传统WSNs的部署与定位机制都难以直接适用于水下。除了从二维网络向三维网络的转变之外,受水流影响导致的节点运动、节点在水下
学位
选用氧化石墨烯(GO)及丁二胺(BDA)在尼龙(Nylon)基底上,利用真空抽滤法多次组装制备复合膜,并将其用于有机溶剂甲醇中染料的脱除,研究了其分离性能。文中采用扫描电子显微镜(SEM)、X射线衍射仪(XRD)、接触角测量仪、X射线光电子能谱仪(XPS)等表征手段对复合膜的微观结构和组成进行了表征,并研究了GO、BDA的浓度、组装层数等因素对复合膜有机溶剂分离性能的影响,探索得出最佳分离膜的制备
期刊
五相电机相比三相电机具有容错性强、转矩脉动小、控制自由度多等优点,在电动汽车、航空航天等领域有着很大的应用价值。本文针对五相永磁同步电机单相、两相和三相开路故障情况,研究了一种适用于三种开路故障的容错控制策略,实现电机在故障下平滑转矩的输出。具体内容如下:首先,按照镜像对称原则设定容错电流,基于控制变量法的思想分两步求解容错电流的相位与幅值。第一步设故障前后电流幅值不变,根据转矩模型建立电流相位与
学位
随着深度学习和大数据技术的快速发展,国网大力推进无人机巡检影像智能识别的应用。绝缘子和销钉是输电线路中的关键器件,但在高分辨率的图像中,现有的算法很难准确检测出复杂背景下较小的缺陷目标。本文根据绝缘子和销钉的各自特点,分别设计了对应的缺陷检测方案。针对绝缘子自爆识别,本文级联了目标检测算法和语义分割算法,在全局和局部两个阶段做缺陷诊断。首先,在原图中初步检测缺陷目标,同时定位出所有的绝缘子,把面积
学位
生物质快速热裂解是生物质转化利用的有效途径,但常因是非催化过程,裂解温度高导致生物油成分复杂难控。以ZnCl2为催化剂,研究了木质素、纤维素、玉米芯和松木粉的热解过程,旨在探索原位催化对快速热裂解的强化作用。通过热重曲线拟合,获得了热裂解的活化能;通过快速热裂解实验,研究了催化作用下热解油组成变化。结果表明,ZnCl2催化可显著降低生物质裂解温度,简化生物油组成。在350℃快速热裂解松木粉获得了4
期刊
显著性目标检测任务的目的是在图像中勾勒出人类视觉最关心的部分,用于后续的算法或是减少图像处理的成本。某些应用环境中光照不足,可见光数据通常会失去大部分性能,而热成像数据可以弥补这一部分的信息损失,提高检测性能。本文针对低光照或是光照不稳定的情况下的显著性检测任务,对光照判别、多源数据融合以及显著性检测展开了研究。具体工作如下:首先基于光照判别数据集,训练光照判别模型。将多源显著性检测数据集输入光照
学位
在实际环境中,语音经常受到噪声的干扰,影响语音质量。通常采用语音增强技术滤除语音信号中的噪声污染,提高语音信号的质量。其中麦克风阵列语音增强算法不仅可以使用语音信号自身的时频域信息,还可以使用各信号间的空域信息,空间分辨率较高,抗干扰能力较强,能够弥补单麦克风对噪声抑制不足的缺点,能够获得更好的语音增强效果,但其增强语音中仍存在残留噪声。因此本文提出一种基于噪声估计的麦克风阵列语音增强系统,主要结
学位