基于自助法填补技术的变量选择方法研究及其应用

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户：tta86

【摘要】

：

在建模过程中经常会碰到许多变量，因此如何从众多变量中选出对因变量较为重要的若干变量，是统计学家们在回归分析中所要考虑的问题。经典的变量选择方法包括基于AIC准则、向前（

【作者】

：

许胜男

【机构】

：

浙江工商大学

【出处】

：

浙江工商大学

【发表日期】

：

2017年期

【关键词】

：

自助法填补稳定性建模过程变量选择方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在建模过程中经常会碰到许多变量，因此如何从众多变量中选出对因变量较为重要的若干变量，是统计学家们在回归分析中所要考虑的问题。经典的变量选择方法包括基于AIC准则、向前（后）法以及逐步回归等已被广泛应用。Tibshirani(1996)提出了Lasso方法，此后众多学者通过对Lasso方法的改进提出了适应性Lasso、Elastic Net等一系列的正则化方法。上述的这些变量选择方法均已被广泛研究于完全观测数据。　　然而，在实际应用中数据缺失的情况会经常发生，与完全观测数据相比，缺失数据存在下的变量选择是一个新的挑战。特别是存在不同的缺失数据机制，并且对于每一个机制有不同的统计方法来处理缺失数据。因此，用于变量选择的方法需要适合缺失数据机制，并用统计方法处理缺失数据。目前基于缺失数据的线性模型的变量选择方面的研究文献较少。　　本文的笔者首先对稳定性选择和Bootstrap Lasso方法做研究，将其应用于完全观测数据，并与其他正则化方法做比较。稳定性选择是一个适用于完全观测数据的普通子采样或重采样的变量选择方法。它具有两个显著的优势:第一，用稳定性选择得到的变量选择结果对正则化数量和门限值π并不十分敏感;第二，随机Lasso的稳定性选择与在设定条件下的变量选择是一致的。在此基础上，笔者研究了可以与填补结合的变量选择方法，即基于自助法填补的稳定性变量选择方法(BISS)和基于自助法填补的Bootstrap Lasso变量选择方法(BIBL)。与现有的方法相比，这两个方法适用于一般缺失数据模式，可以处理高维问题，所有现有的方法只能研究低维问题。本文提出的方法具有一般性，并且适用范围广。本文的模拟研究和实例分析证明了BISS方法的表现是最好的或接近最好的，而且就变量选择而言该方法对调整参数值相当不敏感。

其他文献

中国金融市场化指数设计及其应用研究

金融是现代经济的核心，影响着经济运行的效率和质量。在中国经济跨入“十二五”规划阶段，一个新格局的产生势必要求金融业发挥其新的支持与引导作用；科学判断和评价目前的金融发

学位

金融市场化指数经济增长区域结构特点空间计量方法

Utility-Based Joint Scheduling Approach Supporting Multiple Services for CoMP-SU-MIMO in LTE-A Syste

In this paper, we study utility-based resource allocation for users supporting multiple services in a LTE-A system with coordinated multi-point transmission for

期刊

CoMP-SU-MIMOmultiple servicesscheduling algorithm

中国上市公司估值方法及应用研究

随着中国资本市场的发展,上市公司股票的估值问题日益引起了人们的重视。本文首先结合中国股票市场的发展背景和上市公司的特点,通过对公司股票估值方法的梳理和分析,得出了

学位

上市公司自由现金流量法资本市场股票估值财务分析

从误读新课标的几种现象说起

从语文教学的现状来看,对新课标的解读还存在着种种误区,其中比较典型的有:重人文轻工具,重生成轻预设,重拓展轻文本。反思当前的语文教学,必须学会借助工具渗透人文,必须学

期刊

中国上市公司高管内部人交易行为研究

对于资本市场来说,内幕交易是其最大的毒瘤。而在资本市场还不是十分成熟的我国,内幕交易频频发生,各种消息更是满天飞。如果不能消除内幕交易,我国资本市场的价值投资理念就

学位

上市公司内幕交易经营业绩交易行为

浅谈二维动画造型课程教学研究

在现代动画片的构思与制作领域,动画的造型设计占据着较为重要的位置。高校开设的动画造型课程是培养学生动画造型能力的第一课堂,是动画艺术中造型设计提升的前沿阵地。一般

期刊

二维动画动画艺术动画造型教学前沿阵地课程教学研究关键帧学生自主创新动画作品特征分析第一课堂

多快好省——高品质数码影像批处理技巧

期刊

高品质数码影像

违约率可变的CreditRisk+模型在商业银行信用风险计量中的应用研究

信用风险是债务人到期不能还本付息的风险，是商业银行面临的最主要风险形式之一。信用风险的计量和管理是国际金融界普遍关注的重点。经过过去几十年的发展，西方发达国家的信用

学位

商业银行信用风险计量模型CreditRisk+模型违约率可变

信息产业与制造业融合度及其对制造业绩效影响的研究

信息产业与制造业融合发展是我国一项重要的国家战略，近年愈来愈受到政府、企业及学术界领域的重视。基于“中国制造2025”、“工业4.0”等背景下，深化拓展两化融合，促进信息产

学位

信息产业制造业融合度绩效管理

中小企业商业信用融资区域间比较研究

中小企业的崛起，为中国经济的繁荣作出了巨大的贡献。但是，资金匮乏、融资不畅已成为长期以来制约我国中小企业发展的“瓶颈”。而国际性的金融危机对我国经济造成了严重冲击，中

学位

中小企业商业信用融资区域比较效应因素经营投资

基于自助法填补技术的变量选择方法研究及其应用

与本文相关的学术论文