基于ReLU神经网络的最优函数逼近

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:toky868
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来深度学习在许多领域都取得了优异的表现,如计算机视觉、推荐系统、自然语言处理等。尽管深度学习在应用上取得了极具价值的成果,但是它的理论仍然存在一些重要的问题尚未解决。其中,神经网络的表达能力(Expressive Power),作为深度学习理论的重要组成部分,对我们理解深度学习起到了至关重要的作用。从函数逼近(Function Approximation)的角度看,神经网络的表达能力描述了神经网络逼近任意函数的能力。根据万能逼近定理(Universal Approximation Theorem),只要单隐藏层网络的宽度足够宽,就能以任意精度逼近目标函数。在工业界,人们为了实现更高的准确率,使用的神经网络越来越大。这引起了我们对神经网络表达能力的本质问题的思考:对于一个给定的机器学习任务,在一个给定的网络大小下,最好的准确率是多少?准确率是如何随着网络大小提高的?用数学语言描述,对于一个目标函数,在给定的网络大小下最小的逼近误差是多少?逼近误差是如何随着网络大小减小的?另一方面,我们考虑SGD(随机梯度下降)等神经网络训练方法能否完全展现神经网络的表达能力,如果不能,实际中的逼近误差与理论上的有多大差别?针对以上问题,本文的主要研究内容如下:1.对于一个任意的单变量凸函数,介绍了用段数为n的分段线性(Piecewise Linear,PWL)函数实现最优逼近的充分必要条件。根据该条件,给出了最优逼近误差的上、下界和最优逼近速率。由于神经网络具有非线性的特点,我们分别给出了深度固定和宽度固定的Re LU神经网络结构用来生成最优逼近线段。解释了在该网络结构下的最优逼近误差的上界。2.针对最优函数逼近的理论,设计了一种算法得到最优逼近函数并解释了该算法的收敛性。通过实验验证了该算法的有效性并与传统的逼近方法作比较。我们验证了用SGD方法训练的神经网络不能达到理论上的最优逼近误差,说明了神经网络的表达能力还没有被充分利用。3.设计了一种划分线性区域的方法能够保证样本准确地被划分到所在区域。该方法用来计算神经网络各线性区域的平均逼近误差,说明不同网络结构的表达能力差异。4.对于高维函数,利用通过SGD方法训练的神经网络拟合一个确定的目标函数,计算该函数的拟合误差。对神经元数量相同的不同网络结构进行实验,验证了深层网络比浅层网络具有更强的函数逼近能力。
其他文献
小厕所蕴含大民生。公共厕所作为城市重要的公共设施之一,其环境的好坏直接影响了使用者的如厕体验感受,良好的如厕环境体验使用户在生理和心理上都能得到满足。因此,公共如厕环境设计是较为重要的。在本文公共如厕环境优化设计中,将感性工学理论引入其中,通过从用户角度发现及分析问题,以用户为中心,避免感性思维对设计的主导,结合了理性数据分析,为公共建筑如厕环境提供了一种不同的设计思路。本文首先以国人为目标群体,
学位
静电纺丝是产生微纳米直径细纤维的重要方法,它通过静电拉伸聚合物溶液或熔融体来制造微纳米纤维,在光电子柔性打印、生物制药等领域有着广泛的应用前景。大多数现有研究集中在材料工艺研究和各类应用研究。面向实验装置设计、直写状态检测和控制的研究相对较少。本论文首先回顾了本领域近年来的发展现状。第二章介绍自行搭建的一套静电纺丝直写系统的硬件平台。可以打印熔融树脂材料或者有机物溶液材料。论文介绍了静电纺丝直写实
学位
随着互联网的日益普及和大数据技术的发展,越来越多的组织选择跨领域合作,以实现自身利益的最大化。大多数组织对数据和应用程序安全性保障的需求,都是利用公钥基础设施(Public Key Infrastructure,PKI)提供的服务,然而,随着基于身份的加密(Identity-based Encryption,IBE)技术的发展不断成熟,越来越多的中小企业使用IBE部署内部认证系统。为了保证跨异构认
学位
聚甲基丙烯酸甲酯(PMMA)/碳纳米管(CNT)复合材料具有重量轻、刚度高和热稳定性优良等出色的物理性能,该材料板结构在航空航天领域具有广泛的应用,例如检测损伤的神经元传感器和电磁干扰屏蔽设备。在PMMA/CNT复合材料的使用寿命内,外界扰动导致的振动可能造成结构的损坏,因此需要清晰地认识该材料的振动行为。目前的实验方法和宏观数值方法能够直接获得振动响应,但是无法深层次了解该响应的机理。为更好地了
学位
我国血管支架的年均需求量在100万枚以上,市场需求巨大且瓶颈问题突出。祼金属支架,药物洗脱支架及可降解支架在应用中普遍存在即刻/晚期支架贴壁不良的问题。在支架研究中,核心问题之一是如何保证支架在服役过程中贴壁,使支架支杆被血管内膜覆盖,避免扰动血流而引发危险。现有的支架贴壁性能评价方法中,往往单一考虑支杆与血管壁分离的最大距离或未覆盖支杆的面积占比,较为片面且存在偏差,目前亟待提出一种客观且定量的
学位
如今在目标环境和电磁环境变得愈加严峻的情况下,数字阵列雷达拥有高机动、速率高和强抗干扰能力等特点,使其在现代雷达体系中被广泛应用。数字波束合成模块(digital beamforming,DBF)作为数字阵列雷达的核心模块,是阵列雷达能够稳定可靠运行的保障。因此针对DBF模块及其系统的研究具有重要意义和应用价值。首先通过分析和研究了DBF技术原理以及构成DBF系统的光纤通信、FPGA高速接口、VP
学位
在细胞微环境中,活性氧自由基(ROS)水平增高主要是由氧化还原不平衡而导致的氧化应激所引起的。为了避免氧化应激状态,细胞会上调谷胱甘肽(GSH)等抗氧化分子合成来清除过多的ROS。此外,重金属元素铜也参与细胞内许多氧化还原过程,铜过量会上调ROS水平引起氧化应激和细胞凋亡。在肿瘤微环境中,活性氧自由基引起的氧化应激十分常见。近红外生物荧光成像技术作为高灵敏度、高选择性的检测手段受到广泛的关注,但其
学位
互联网信息技术的快速发展给人们的生活带来了诸多便利,但其中藏匿的安全问题不容忽视。当前网络环境中的主要威胁来源是恶意软件,通过恶意软件发起的攻击会对网络环境造成严重的冲击,因此对恶意软件进行有效且及时的检测具有重要的研究意义。然而,目前主流的基于机器学习的恶意代码检测方法无法实现对恶意代码自动化和高效的识别。为此,许多研究者将恶意代码可视化以更加直观和客观的对其分析,在此基础上利用卷积神经网络的自
学位
通过物理或化学变化进行生产的行业被称为流程工业。近年来,流程工业正向智能优化制造方向发展。流程工业生产制造过程具有强实时性,企业在不断发展的过程中,生产制造点也在不断的增加,导致流程工业生产过程中的数据成倍增加。由于各企业间没有建立统一的数据标准,存在大量实时数据出现异构问题。产品从原料获取、生产、使用直到废弃这一过程称为产品的全生命周期,对流程工业全生命周期的数据进行集成是本文研究的重点之一。目
学位
硝酮是一类生物和医学上重要且应用广泛的化合物,具有抗氧化、抗增殖、抗炎、抗菌的作用。目前,对于一些结构相对简单的硝酮化合物的合成已有相关文献报道,然而,对于多官能团化的硝酮化合物的制备,目前已报道的文献中存在一些明显的问题以及合成方法的局限性。因此,开发简便、高效的合成多官能团化的硝酮化合物的新方法是当前迫切需要解决的问题。α-卤代腙属于一类合成功能广泛且功能强大的合成子,可参与许多化学转化。基于
学位