【摘 要】
:
近些年来,神经网络模型已经成为机器学习中一种广泛使用的模型,并且在许多任务上取得了巨大的成功。研究神经网络模型的泛化性能也是深度学习领域的研究热点之一,但到目前为
论文部分内容阅读
近些年来,神经网络模型已经成为机器学习中一种广泛使用的模型,并且在许多任务上取得了巨大的成功。研究神经网络模型的泛化性能也是深度学习领域的研究热点之一,但到目前为止,对模型泛化能力的理论解释仍不完善。本文受集成学习中基分类器多样性的启发,引入了神经元多样性来探究影响模型泛化性能的原因。为了研究多样性对模型泛化性能的影响,本文引入了不相关性和平等性来定义神经元的多样性。其中,不相关性旨在促进各个神经元学习多样的特征,而平等性保证了不同神经元在模型中都发挥显著的作用。具体地,我们得到了一个基于多样性的模型泛化误差的边界,证明了多样性是影响模型泛化误差的关键因素。同时,我们证明了多样性与神经网络参数的两个统计量有关:权重矩阵的正交性和权重矩阵的均匀性。理论结果表明,我们可以通过增强权重矩阵的正交性和均匀性来增强模型多样性进而提升模型的泛化性能。为了验证我们的理论结果,本文提出了正交-均匀神经网络模型(Orthogonality-Uniformity Neural Network,OUNN),该模型可以同时保证网络的正交性和均匀性。我们在MNIST,SVHN,CIFAR数据集上进行了实验,其中在MNIST,CIFAR数据集上的实验结果验证了多样性和模型泛化性能的关系。OUNN模型在SVHN和CIFAR的数据集的实验结果说明了正交-均匀性有利于提高模型的泛化能力。
其他文献
集装箱海铁联运具有安全可靠、运价低廉、运输高效、绿色环保等诸多优势,在近年来也受到了越来越多的重视。随着国际间合作的不断深化,推动着港口的快速发展,对海铁联运的作
目前研究表明,活性污泥热解处理制备生物质炭可在农业中应用,与将活性污泥直接施用在土壤中相比较,活性污泥生物质炭可更好的促进植物生长。但在实际应用中,还需考虑活性污泥
Ti-Al合金因其高弹性模量、良好高温性能、优异抗蠕变性能及小的密度和高组织稳定性的特点而受到广泛关注,本文针对Ti Al基合金室温塑性低,高温下抗氧化性能不足能较差等缺点
超声层析成像(Ultrasonic Process Tomography,UPT)基于不同介质中的超声波传播特性,通过超声传感器阵列向被测区域发射超声波信号构建声学敏感场,同时获得超声波由于场内声
我国是资源大国,河流湖泊众多,其中不乏许多跨行政区域的河流。随着我国人口和经济的快速发展,河流沿岸各地方政府围绕河流资源的开发和利用常常产生各种矛盾。同时,随着我国
随着科学技术的快速发展,信息化不断推广,实体之间共享数据进行联合计算已成为普遍的社会现象.但在现实生活中,许多数据包含着个人的隐私,若不加保护地将隐私信息与他人共享,
目的探讨2型糖尿病患者血清25-羟维生素D3[25(OH)D3]水平与代谢综合征(metabolic syndrome,MS)各组分及患病风险的关系。方法收集2017年1月到2018年12月在上海交通大学医学院附属
随着移动互联网的飞速发展,社交网络已经成为人与人之间沟通交流的重要方式。越来越多的个体参与到社交网络活动中,形成了海量的个人和社会关系信息。这些信息蕴含着巨大的研
煤与瓦斯突出是多种因素的综合作用下产生的极其严重的动力现象,查阅国内外相关资料和文献表明,含水率对煤与瓦斯突出有着显著的影响。因此,本文在研究芦岭8煤层瓦斯赋存规律
全国中小企业股份转让系统(新三板)是经国务院批准设立的全国性证券交易平台。由于新三板市场准入门槛低、监管环境相对薄弱等原因导致该市场的挂牌企业大都存在成立时间短、