正则化极限学习机分类及回归算法研究

来源 :西安邮电大学 | 被引量 : 0次 | 上传用户:phlok1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极限学习机(Extreme Learning Machine,ELM)是一种训练单层前馈神经网络(Single-hidden Layer Feedforward Neural Networks,SLFNs)的机器学习方法,对于解决分类和回归问题具有明显的优势。ELM是对反向传播算法(Backward Propagation,BP)的改进,不仅有效地克服了BP算法存在的训练速度慢的缺点,而且具有很好的泛化性能。凭借这些优点,ELM被广泛应用于语音识别、故障诊断、股票价格预测、图像处理等多个实际领域。为了提高算法的预测或分类的精度,学者们在ELM的基础上对算法进行改进,提出了正则化极限学习机(Regularized Extreme Learning Machine,RELM)。然而,在实际应用时,数据中往往会掺杂噪声和异常值,使得算法的性能下降。由于RELM无法针对性地对噪声和异常值进行处理,导致模型容易出现过拟合问题,大大降低了算法的泛化性能,因此,本文在RELM相关理论的基础上,主要从损失函数和隶属度函数的角度改进RELM,工作内容如下:1、提出了基于CCCP算法的L2,1范数鲁棒正则化极限学习机(L2,1-norm Robust Regularized Extreme Learning Machine,L2,1-RRELM)。L2,1-RRELM首先考虑将平方损失函数替换为非凸损失函数,通过对噪声和异常值给予恒定惩罚,以减少其不利影响。同时,用L2,1范数代替RELM中结构风险的L2范数,根据重要程度将不同的隐含层神经元进行划分,并删除不重要的神经元,使模型稀疏化。针对L2,1-RRELM的非凸特性,采用凹凸法求解模型,并在理论上证明了算法的收敛性。将L2,1-RRELM应用于添加不同程度噪声的人工数据集和UCI数据集上进行实验验证。通过实验结果分析表明,L2,1-RRELM具有较好的泛化性能、较强的鲁棒性和抗噪声能力。2、提出了基于非对称C损失函数的L1范数鲁棒正则化极限学习机(L1-norm Robust Regularized Extreme Learning Machine with Asymmetric C-loss,L1-ACELM)。传统的RELM采用平方损失函数作为经验风险,由于它的无界性,使得模型对于噪声和异常值缺乏鲁棒性,同时,由于该损失函数是对称的,使得算法在处理非对称数据时泛化性能较低。为了解决这些问题,提出了有界、非凸、非对称C损失函数,并用其代替RELM中的平方损失,减少噪声和异常值对算法的影响,通过调整非对称参数,提高算法的泛化性能。与此同时,用L1范数代替L2范数得到稀疏化的数学模型。在求解过程中,采用半二次优化算法进行求解,并在理论上证明了算法的收敛性。将L1-ACELM应用于添加不同类型噪声的人工数据集和UCI数据集上进行实验验证。通过实验数值分析表明,在大多数情况下,L1-ACELM比原有算法具有更好的泛化能力。3、提出了模糊正则化最小二乘孪生极限学习机(Regularized Fuzzy Least Squares Twin Extreme Learning Machine,RFLSTELM)。相比于传统的ELM,RFLSTELM只需要求解两个较小规模的线性方程组,在一定程度上减少了训练时间。为了改善模型的过拟合问题,在模型中加入正则化项,同时引入隶属度函数给每个样本点分配不同的权重以削弱噪声点对模型的影响。将RFLSTELM应用于不同规模的NDC数据集和UCI数据集上进行数值实验。实验结果表明,RFLSTELM具有较好的分类性能。
其他文献
文本匹配作为自然语言处理中的一项基本任务,广泛应用于信息检索、文本挖掘等领域。在实际应用中,文本匹配任务仍面临诸多挑战。现有主流的文本匹配模型通常存在一词多义、语义信息捕获不准确等问题,导致句子的上下文信息和隐含的语义信息不能被有效提取,造成准确率较低。为了解决以上问题,本文提出交叉知识增强的文本语义匹配模型,该模型基于全局-局部交叉知识增强和细粒度交叉知识增强的语义匹配方法实现。本文的主要研究工
学位
随着我国老人的增多,老年疾病患病率也随之增高。在老年骨病患者中,绝大多数病症都与股骨相关。目前国内针对股骨近端骨折的主要治疗方法为髋关节假体置换。而这些假体大部依赖于进口。根据西安交通大学第二附属医院和中国人民解放军总医院的临床实践表明,目前进口的假体和钢板并不能很好匹配国人的股骨形状,造成术后恢复效果差。股骨参数测量可以辅助医生设计人工假体,同时还可以协助医生选择适合手术方案和器械。此外利用测量
学位
深度神经网络(Deep Neural Network,DNN)作为人工智能最杰出的代表,被广泛应用于各个领域。然而,近期研究表明,高精度DNN模型极易受到对抗样本的攻击。对抗样本是人为经过特定对抗攻击算法所生成的恶意攻击样本,能在不影响人类正常视觉辨别的同时,使DNN模型产生高置信度的预测错误或分类错误。对抗样本揭露了DNN易被攻击的特性,是DNN巨大的安全漏洞。因而提升DNN对对抗样本的防御能力
学位
引线框架作为半导体芯片的载体,是半导体封装领域所用到的重要基础原材料,主要用来保护半导体芯片免受外界物理或化学因素的损害,并同时用作导通介质。引线框架的生产方式是利用引线框架掩模在曝光机上对生产原材料(铜基板)进行曝光,将曝光后的半成品进行显影、蚀刻、电镀等工序后获得成品。若曝光环节出现的缺陷未被检出,会导致后续环节中的错误进一步扩大,所以生产厂商都会在曝光环节设立检测点。引线框架曝光缺陷尺寸微小
学位
极化合成孔径雷达是一种高精度成像雷达,可以获得丰富的目标和土地覆盖信息,极化合成孔径雷达不仅成像分辨率高,而且还具有全天候对地观测的特点,在运转时不会因为光照、气候等条件而受到干扰,甚至可以穿透掩盖物获取其覆盖的信息。合成孔径雷达这些优点使得其在农业、环境、地质和军事等领域得到了广泛应用。传统的极化SAR图像分类方法通常会忽略掉极化SAR图像像素点之间的空间信息,分类效果常常达不到预期。本文的主要
学位
学位
生物特征识别在信息安全领域发挥着重要作用,掌纹识别作为一种新型生物特征识别方式,具有低失真、非侵入性和高唯一性等优势。传统掌纹研究大多使用自然光成像系统以灰度格式获取,识别精度很难进一步提升。为了获得更多的身份鉴别信息,利用多光谱掌纹图像代替自然光掌纹图像,根据不同波长的光谱对皮肤的吸收和反射率不同,捕获每个波段中特定和互补的掌纹特征。因此,本文探讨了基于多光谱图像的掌纹融合识别方法。1.针对传统
学位
随着智能物联网时代的来临,边缘计算作为一种新的计算方式,凭借其超低时延和超高可靠性的优势被应用于各个领域。然而,传统的CPU和GPU平台无法满足边缘计算实时和功耗的需求,急需高效低功耗的平台对应用进行加速。因此,本文设计并实现了基于异构多核FPGA平台的加速器,并对设计空间进行探索与寻优,以满足上述的需求。本文的主要研究工作如下:1.卷积运算中普遍存在数据读写依赖,导致执行过程无法完全并行,而串行
学位
喉癌作为头颈部常见的癌症,其早期症状通常不明显,当其开始影响患者的生活质量时,往往已经发展到了中晚期。因此,尽早发现可疑病变,有利于病情的及时确诊和后续治疗方案的确定。目前,在喉部检查过程中广泛采用的是内镜白光成像技术,其对于发生在粘膜浅层的病变敏感度较低,窄带成像技术由于能够清晰显示粘膜浅层的微小病变,成为发现早期癌变的有力工具。但这种成像技术依赖于特定设备以及检查医师的操作,视觉感知的微妙差异
学位
报纸