【摘 要】
:
随着大数据人工智能时代的来临,传统的回归分析方法在海量高维且自变量存在相关关系数据面前已经失效。本文针对回归模型的局限性以及子集特征选择方法和岭回归特征选择方法
论文部分内容阅读
随着大数据人工智能时代的来临,传统的回归分析方法在海量高维且自变量存在相关关系数据面前已经失效。本文针对回归模型的局限性以及子集特征选择方法和岭回归特征选择方法的不足,提出了Lasso特征选择方法及其改进算法,并对Lasso算法进行模拟实验及国内生产总值实证分析。当自变量之间出现多重共线性时,最小二乘估计值将会不稳定,方差变大,回归模型预测精度很低,因此如何解决自变量很多且存在多重共线性成为所研究问题的关键。子集选择法和岭回归方法可以用来处理此类问题,可是子集选择法和岭回归方法均存在不足,子集选择方法是一个离散变量选择过程,要么选择变量,要么剔除变量,因此可能会损失重要信息,而岭回归方法是连续变量压缩过程,没有将任何系数收缩为0,因而这个方法不能给出一个简单的可解释的模型。而Lasso方法结合了这两个方法的优点。本文主要介绍了Lasso回归的定义以及lasso回归相应算法,介绍了坐标轴下降算法和最小角回归算法。由于最小角回归算法的优越性,着重介绍了该算法以及其两个导向算法,向前选择算法和向前梯度算法。针对Lasso回归方法的不足,还介绍了两种lasso回归模型的改进方法,分别为自适应Adaptive Lasso模型和Elastic Net模型。并针对最小角回归算法进行了仿真实验,进一步了解了该算法选择变量的过程。最后建立最小角回归模型、Adaptive Lasso模型和Elastic Net模型对国内生产总值进行实证分析,并对这三种模型进行比较,得出了Adaptive Lasso模型具有最小的预测误差,并根据该模型回归系数进行了相关建议。
其他文献
高三复习教学是知识点的浓缩式教学,这需要教学中对于重要知识问题进行整合、有效的设计,而不能仅仅就题论题.近期观摩了本地区某校形老师关于向量小题知识的复习课,令笔者对于复
所谓记忆.是指一个人在生活实践的过程中把新的知识经验吸取并保留下来,而且在有关的环境中能提取已有的知识经验的心理过程.记忆分为一般记忆和特殊记忆两种情形.所谓一般性记忆
中国国有企业特别是96家中央管理企业,在我国发挥着提供公共产品,保障重大投资项目建设,帮助国家宏观调控的基本功能,同时还具有完善我国社会主义经济制度,加快推进社会发展,增强关键行业掌控力,防范重大经济风险的特殊功能,在我国国民经济中占有重要地位。目前,世界政治经济格局深度调整转型,中国经济步入新常态发展,传统模式的劣势越来越明显,重塑世界经济结构和竞争格局的关键已转变为创新,创新也成为推动中国经济
财务管理在企业的日常经营管理活动中是非常重要的,其中营运资金管理也受到了企业管理者的“特别关注”。以往的几十年来人们在营运资金管理时都是根据单个项目基于要素来进行的,这属于传统的营运资金管理模式。但是这种传统的管理方法存在着许多不足之处,它并不能使企业管理者更全面、更有效的进行营运资金管理。随着经济的发展、管理模式的改进,传统的营运资金管理方法已经不能够满足企业的经营管理需要。基于渠道管理的营运资
对于“华夏”而言,二十世纪上半叶的中国西南康区是一个在地理、政治、经济、文化与语言上的多重边缘(muliti—boundaries)。在当时汉藏双方彼此语言不通的情况下,兼通汉、番语的
陕西华源矿业有限责任公司现面向社会寻求浸出槽防腐的解决方案。
最短路径查询是图论研究中的热点问题之一,最短路径查询在很多领域中扮演着最基本也最重要的角色,包括城市交通网络、社交网络、生物信息网络等。目前最短路径查询算法主要有
近年来,我国实行的新课改为学校教育提供了新的平台,国家逐步加大了对职业教育的重视程度,促使职业中学成为职业教育的主力军,为国家的长期发展培养出多种专业技能的后备人才。职业中学与普通中学的不同之处在于,职业中学的体育教育不仅要将学校的培养目标和学生的专业、工种结合起来,还要适应学生身体和心理的特点,帮助职业中学的学生确定明确的目标和把握职业方向,为社会培养出高技术的专业人才。从县级职业中学角度出发,
本文回顾性分析椎管外软组织损害引起颈肩腰腿痛患者经银质针治疗出现18例并发症的临床资料,从并发症的种类、处理方法分析银质针疗法的特点及注意事项,探讨预防及减少银质针所
目的:探讨用颈椎前路手术治疗颈椎间盘突出症的临床效果。方法:回顾性分析2011年5月至2015年1月期间在某院进行颈椎前路手术治疗的26例颈椎间盘突出症患者的临床资料。对这26例