面向噪声数据的正则化学习算法研究

来源 :中国计量学院 | 被引量 : 0次 | 上传用户：cmudh134

【摘要】

：

本文主要研究面向噪声数据的正则化学习算法,并对随机权网络(NNRW)相关算法进行了改进.随机权网络算法具有快速学习能力以及强大的逼近能力,然而,当出现噪声数据时,其模型不

【作者】

：

叶海良

【机构】

：

中国计量学院

【出处】

：

中国计量学院

【发表日期】

：

2015年01期

【关键词】

：

噪声数据随机权网络 l2-l1 正则化学习概率鲁棒学习分布式学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要研究面向噪声数据的正则化学习算法,并对随机权网络(NNRW)相关算法进行了改进.随机权网络算法具有快速学习能力以及强大的逼近能力,然而,当出现噪声数据时,其模型不具有稳定性和稀疏性,特别地,对于离群点(Outliers)并不鲁棒,甚至当训练样本集太大时,该方法可能无法求解.基于此,本文针对随机权网络算法展开了研究和讨论,主要包括基于随机权网络的l2-l1正则化学习算法研究,基于鲁棒建模的概率随机权网络算法研究和基于大样本数据的分布式近似牛顿型随机权网络算法研究.具体工作概括如下：1.我们提出了随机权网络的l2-l1正则化模型,旨在同时考虑随机权网络的稀疏性和稳定性.由于l1范数不可微使得l2-l1-NNRW模型无解析解,我们利用凸分析工具构造不动点迭代方法来求解该模型,从而提出了l2-l1-NNRW算法.在激活函数有界的约束下,我们从理论上证明了l2-l1-NNRW模型的收敛性、稀疏性和稳定性,保证了训练网络的有效性.实验结果表明,l2-l1-NNRW算法不仅能避免过拟,合,而且还具有较好的性能,且解具有稀疏性和稳定性.2.针对随机权网络对于离群点不鲁棒的问题,我们提出了一种新颖的概率鲁棒随机权网络(PRNNRW)算法,试图增强随机权网络对离群点的鲁棒性.其关键思想是利用离群点在样本中的最稀疏性,结合压缩感知理论提出了基于l1损失函数和l2正则项的鲁棒随机权网络.基于Laplace噪声分布及高斯先验假设,我们给出了鲁棒随机权网络模型的概率解释,利用Laplace分布的分层表示性质等价地转化成概率问题.为了求解概率鲁棒随机权网络模型,我们基于期望最大化(EM)算法设计了PRNNRW算法.实验结果表明,PRNNRW算法对离群点具有更好的鲁棒性.3.针对随机权网络对大样本数据无法求解的问题,我们提出了一种分布式近似牛顿型随机权网络(DANE-NNRW)算法,使得能够训练大样本数据.由于随机权网络对于大样本数据的不适用性,我们将样本首先分成若干个子样本集,对于每个子样本,建立一个局部学习模型.其关键思想是对于局部模型利用分布式近似牛顿方法,既考虑每个局部模型内部处理又考虑与其它局部模型之间的联系.根据Bregman散度和泰勒公式,得到了求解外权的DANE-NNRW迭代算法,并从理论上证明了其收敛性,从而保证了DANE-NNRW算法能够有效训练大样本数据问题.实验结果表明,DANE-NNRW算法对于大样本数据具有较好的效果.

其他文献

莆田市土地资源在经济发展中的可持续利用研究

近年来，我国土地资源的使用现状严峻，国家迫切要求各省市尽快实现土地资源的可持续利用。土地资源一般指能够供养生物的陆地表层，包括内陆水域但排除海域在内，是人类生存发展的前

期刊

莆田市经济发展土地资源可持续利用

基于图形表示的RNA二级结构相似性分析及其应用

随着转录组和表观遗传学的发展,RNA在生命活动中扮演角色的重要性不断被科学家证实。通过对RNA结构的相似性分析,可以实现RNA分类,进而可以帮助我们了解RNA的一些生物功能。

学位

RNA二级结构图形化表示相似性分析系统发育树假结非编码RNA

时间序列预测方法在港口行业中的应用

行业的经济走势一直是政府和企业关注的焦点,及时了解趋势变化,就能趋利避害,掌握经济决策的主动权为企业赢得利益.因此,对某行业的某些重要指标建立起预测模型,就显得非常重

学位

时间序列港口吞吐量预测ARMA模型ARIMA模型

基于J2EE框架与SAS组件的航空公司客户关系管理分析系统的设计与实现

　　客户关系管理(CRM)解决方案是企业的一项有效竞争策略，能使企业完整掌握客户信息，了解客户需求。常旅客系统的航空公司客户关系管理解决方案的重要组成组成部分，本文以航空

学位

客户关系管理AIR-CRM常旅客系统J2EESAS有效竞争策略

黎曼的几何思想的萌芽——数学、物理和哲学的交融

黎曼是19世纪最伟大的数学家之一，他的几何思想不仅是19世纪最精彩的思想，也是融合了数学、物理和哲学的典范。研究伟大思想的产生和发展不仅具有深刻的历史意义，而且对当今数学

学位

黎曼几何思想物理哲学数学史科技史

有限正态混合模型的参数估计与应用

混合模型的历史可以追溯到约100年前的K.Pearson时代.第一篇关于混合模型的论文是K.Pearson(1894)用矩估计方法来估计如下两成分正态混合模型的参数：f(x，π，θ1，θ2，σ1，σ2)=πψ(

学位

混合模型可识别性EM算法似然估计同变估计渐近正态性

关于二阶退化双曲型方程的Darboux问题研究

由于喷气理论、高速空气动力学、跨音速和超音速等现代科学技术实际问题的需要，混合型偏微分方程的研究被人们所关注，尤其是退化椭圆型及退化双曲型方程的定解问题成为必须研究

学位

退化双曲型方程第一Darboux问题第二Darboux问题不动点定理数值解存在唯一性

指数Ornstein-Uhlenbeck模型下的期权定价

期权定价理论是现代金融学的重要组成部分,与投资组合理论、资本资产定价理论、市场有效性理论以及代理问题一起,构成现代金融学的五大理论模块.对于传统的Black-Scholes模型

学位

指数O-U模型随机利率跳-扩散过程鞅方法Ito公式

求真务实加强党委思想作风建设

近年来,我们人武部党委认真学习党的三代核心领导关于“求真务实”的一系列论述,大力加强和改进党委思想和作风建设,增强了党委班子的创造力、凝聚力和战斗力,人武部连续17

期刊

思想作风建设人武部建设思想根基核心领导秉公用权支部党员党委成员党委决策党委工作民主生活会

阶段结构捕食系统和时标动态方程的渐近行为

本文主要包括两个方面的内容.其一，建立并系统地分析了滞后型阶段结构对连续Lotka-Volterra捕食系统解的渐近行为的影响.其二，系统地讨论了时标动态方程的定性和稳定性问题.　

学位

泛函微分方程阶段结构捕食系统时标动态方程渐近行为种群动力学模型

面向噪声数据的正则化学习算法研究

与本文相关的学术论文