基于非均衡数据对神经网络激励函数的改进研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zymmhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和普及应用,在极大丰富信息资源的同时,数据量爆炸的问题也伴随而来。原先的机器学习算法已不能满足对海量数据提取信息的需求。因此在大数据的背景下,设计出可以对大量数据进行高效运算的新算法成为当务之急。本文以模仿生物脑细胞工作原理的人工神经网络算法作为切入点,并考虑样本非对称性的影响,针对激励函数提出算法的改进方案。首先在实际应用中,一些案例正负类样本的非对称性问题对算法的学习造成了极大的迷惑性。因此在建立模型前的数据预处理阶段,先平衡好正负类样本的差异,会使得后面算法表现更优。本文分别研究了欠采样(Tomek Links等)、过采样(SMOTE等)和综合采样(SMOTE+ENN)方法的原理及优缺点,最后选择表现最好的SMOTE+ENN综合采样法处理实证样本。激励函数作为算法非线性性的强力表达,其表现能力的好坏直接影响到算法结果的准确性。在BP算法中,激励函数导数直接影响模型权重最后是否可以收敛以及收敛的速度。对比Sigmoid等激励函数,最后选择表现最好的swish激励函数并对其进行改进。分别对改变函数形状的各个参数进行分析,推导它们在神经网络模型拟合中的过程,并给出改进意见。最后通过对台湾信用卡用户违约情况的数据集对上述改进进行验证,对比结果发现,通过对激励函数的改进可以改变算法对正负类样本的理解,达到提高算法效率以及精确度的目的。
其他文献
CRRT(Continuous Renal Replace Treatment连续性肾脏替代治疗)是以缓慢的血流速和/或透析液流速。通过弥散和(或)对流进行溶质交换和水分清除的血液净化治疗方法的统称。随着血液
在现代有轨电车进入复兴时期以来,国内城市进入了现代有轨电车的大规模的快速发展时期。但当前国内城市对现代有轨电车的功能缺乏清晰的定位,对其评价褒贬不一,缺乏有力的评价依据。因此,有必要结合国内的实际环境与发展阶段,研究现代有轨电车的功能特点与适应其特点的评价方法,为今后现代有轨电车与城市公共交通系统的发展与完善提供参考和借鉴。本文首先从现代有轨电车的发展现状入手,对国内外城市分别进行了总结与归纳。国
去年秋天,我在窗户外挂了一个喂鸟的粮槽。我其实对野鸟的习性一窍不通,以为粮槽一挂出来,一众亮丽夺目的飞鸟就会马上朝这新装置猛扑过来。可是,日复一日,周复一周,月复一月
期刊
众所周知,光纤陀螺以其特有的优点,成为了惯性导航、姿态控制领域中最具吸引力的角速度传感器。深入研究光纤陀螺输出噪声特性对于提高光纤陀螺的性能,特别是降低随机游走(ARW)和
告知义务是海上保险重要环节之一,也是《海商法》不可或缺的组成部分。在信息不透明的情况下,告知义务可以保护保险人的合法权益,避免道德风险的发生以及市场失灵,维护海上保险市场秩序。经过二十多年的社会变化,《海商法》中的内容与时代发展渐行渐远。特别是海上保险告知义务的规定已经无法满足日益复杂的海上保险实践,严重制约海上保险的发展。为了更加科学合理地对我国海上保险告知义务进行改进,特别要研究以下问题,一是
金属-有机框架物(Metal-Organic Frameworks,MOFs),是指由金属离子中心和有机配体通过配位键有序组装而成的具有开放式多孔结构的聚合物材料。由于金属离子与有机配体选择范围
HIV-1在中枢神经系统的感染是AIDS痴呆综合征(AIDSDementiaComplex,ADC)形成的直接原因[1]。ADC在临床上表现为认知,运动和行为机能障碍;在病理上表现为大脑萎缩及包括基底神经节在内的白质和深灰质结构异常。因此,了解HIV..
本文详细介绍为通过在校园网建设过程中对相关问题的研究,通过TRUNK技术对VLAN进行优化,提高校园网的稳定性、可靠性,经实践应用表明此方案可行,在互联网中具有广泛应用空间。
利用磁阻传感器感知磁航向,对此航向加入误差模拟电罗经航向,磁罗经与此航向比对,模拟实际工作环境中磁罗经与电罗经比对测定消除磁罗经自差,解决了实验室无法进行此项目相关
文章阐述高校政府采购协议供货制度的特点和现状,指出当前协议供货制度在高校政府采购中发挥着重要作用,并在分析和总结其存在的问题后,基于高校政府采购工作实践,提出了具体改进