基于自助法填补技术的变量选择方法研究及其应用

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:tta86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在建模过程中经常会碰到许多变量,因此如何从众多变量中选出对因变量较为重要的若干变量,是统计学家们在回归分析中所要考虑的问题。经典的变量选择方法包括基于AIC准则、向前(后)法以及逐步回归等已被广泛应用。Tibshirani(1996)提出了Lasso方法,此后众多学者通过对Lasso方法的改进提出了适应性Lasso、Elastic Net等一系列的正则化方法。上述的这些变量选择方法均已被广泛研究于完全观测数据。  然而,在实际应用中数据缺失的情况会经常发生,与完全观测数据相比,缺失数据存在下的变量选择是一个新的挑战。特别是存在不同的缺失数据机制,并且对于每一个机制有不同的统计方法来处理缺失数据。因此,用于变量选择的方法需要适合缺失数据机制,并用统计方法处理缺失数据。目前基于缺失数据的线性模型的变量选择方面的研究文献较少。  本文的笔者首先对稳定性选择和Bootstrap Lasso方法做研究,将其应用于完全观测数据,并与其他正则化方法做比较。稳定性选择是一个适用于完全观测数据的普通子采样或重采样的变量选择方法。它具有两个显著的优势:第一,用稳定性选择得到的变量选择结果对正则化数量和门限值π并不十分敏感;第二,随机Lasso的稳定性选择与在设定条件下的变量选择是一致的。在此基础上,笔者研究了可以与填补结合的变量选择方法,即基于自助法填补的稳定性变量选择方法(BISS)和基于自助法填补的Bootstrap Lasso变量选择方法(BIBL)。与现有的方法相比,这两个方法适用于一般缺失数据模式,可以处理高维问题,所有现有的方法只能研究低维问题。本文提出的方法具有一般性,并且适用范围广。本文的模拟研究和实例分析证明了BISS方法的表现是最好的或接近最好的,而且就变量选择而言该方法对调整参数值相当不敏感。
其他文献
金融是现代经济的核心,影响着经济运行的效率和质量。在中国经济跨入“十二五”规划阶段,一个新格局的产生势必要求金融业发挥其新的支持与引导作用;科学判断和评价目前的金融发
In this paper, we study utility-based resource allocation for users supporting multiple services in a LTE-A system with coordinated multi-point transmission for
随着中国资本市场的发展,上市公司股票的估值问题日益引起了人们的重视。本文首先结合中国股票市场的发展背景和上市公司的特点,通过对公司股票估值方法的梳理和分析,得出了
从语文教学的现状来看,对新课标的解读还存在着种种误区,其中比较典型的有:重人文轻工具,重生成轻预设,重拓展轻文本。反思当前的语文教学,必须学会借助工具渗透人文,必须学
期刊
对于资本市场来说,内幕交易是其最大的毒瘤。而在资本市场还不是十分成熟的我国,内幕交易频频发生,各种消息更是满天飞。如果不能消除内幕交易,我国资本市场的价值投资理念就
在现代动画片的构思与制作领域,动画的造型设计占据着较为重要的位置。高校开设的动画造型课程是培养学生动画造型能力的第一课堂,是动画艺术中造型设计提升的前沿阵地。一般
信用风险是债务人到期不能还本付息的风险,是商业银行面临的最主要风险形式之一。信用风险的计量和管理是国际金融界普遍关注的重点。经过过去几十年的发展,西方发达国家的信用
信息产业与制造业融合发展是我国一项重要的国家战略,近年愈来愈受到政府、企业及学术界领域的重视。基于“中国制造2025”、“工业4.0”等背景下,深化拓展两化融合,促进信息产
中小企业的崛起,为中国经济的繁荣作出了巨大的贡献。但是,资金匮乏、融资不畅已成为长期以来制约我国中小企业发展的“瓶颈”。而国际性的金融危机对我国经济造成了严重冲击,中