大样本线性回归模型的子抽样及变量选择

来源 :统计与决策 | 被引量 : 0次 | 上传用户:wanmei_zxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章考虑了大样本下线性回归中同时进行快速估计和变量选择的问题,即针对一个存在稀疏解的大样本线性模型,根据重要性抽样分布从全数据集抽取少量子样本,对该子样本进行自适应Lasso估计.通过随机模拟研究,将该算法分别应用在几种不同的数据集中,并从模型预测精度和可解释性两个方面比较了四种子抽样方法在该算法下的表现.模拟结果表明,所提出的算法具有良好表现,在计算开销上也具有一定优势.
其他文献
基尼系数是测量收入差距的最常用指标,自提出以来学者们演绎出了很多种测算方法,对于离散数据主要有平均差法、几何方法、矩阵法和协方差法等,但这些方法实质上是一致的,只是形式有所不同.文章以上述方法为基础,以分组数据为研究对象,假定各阶层的收入同分布且与总体分布相似,利用“逼近法”来拟合洛伦兹曲线,并在此基础上提出了一种较为简洁的测算基尼系数的方法.对我国部分年份不同群体基尼系数的测算结果表明,所提方法是可行的.
许多经济变量(如GDP)水平序列随着时间变化具有单调趋势,截面数据(如各地区GDP)之间存在差异,为了研究经济变量在一段时间内的平均发展水平和相互关系,文章基于区间型符号数据的研究视角,提出了一种基于分位数思想的Bayesian回归方法,用以分析内部存在非对称分布散点的区间数据,既可以估计数据的区间,也可以预测数据在此区间内的偏度和离散程度.在模拟研究中,通过对评价指标数值的假设检验分析了该模型相对于上、下限和中点半径模型的效果,并根据真实数据中存在异常信息的现象,在模拟数据中加入异常值,进一步验证分位数
构建合理的评价指标体系是测度经济高质量发展的核心问题.文章在使用文献研究法的基础上引入无监督特征选择算法,构建经济高质量发展评价指标体系.通过借鉴相关研究,采用无监督特征选择多子空间随机化协作模型优化筛选初始集,最终形成含6个子系统30个经济指标的经济高质量发展评价指标体系,并通过测度2011-2019年我国经济高质量发展水平检验了所构建的指标体系的适用性.
文章基于2009-2018年中国省际面板数据,从高校R&D投入、高校R&D产出和高校R&D影响三个维度构建了中国高校R&D资源配置水平评价体系,采用熵权法、Dagum基尼系数分解法、传统Markov链与空间Markov链对我国高校R&D资源配置水平的分布、差距及动态演进进行了定量分析.结果 表明:(1)中国高校R&D资源配置水平整体偏低且呈现明显的空间分异特征,东部省份高校R&D资源配置水平比较高.(2)Dagum基尼系数分解结果表明,中国高校R&D资源配置水平在总体差距上呈现波动下降的趋势.(3)Mar
文章构建了三维面板结构VAR模型,并提出参数估计的一致性方法,编制估计程序,仿真模拟有限样本性质.结果 表明:在给定N1、N2的情况下,随着T的增加,参数的估计值与真值的偏差逐渐减少,并逼近于0;当T固定时,逐渐增大N1、N2,偏误逐渐减小,也都趋近于0.随着样本容量的增大,参数估计量的标准误均有逐渐减小的趋势.通过JB检验发现参数估计量都接受服从正态分布的原假设,具有较好的正态性.
为了反映系统动力学在经济管理理论与方法中的应用现状,文章重点对2014年以来发表在国内外主流学术期刊上的相关论文进行了系统性综述.分别从系统动力学与经济管理理论与工具、计算方法、综合评价理论和其他仿真模拟方法等结合的情况进行了研究.尝试将系统动力学与经济管理理论与方法进行有效结合,将是研究者们获得突破的重要途径;从理论层面解决系统动力学与经济管理理论与方法的耦合,将是未来研究的一个重点方向;如何实现经济管理理论与方法和系统动力学的内化结合,是未来研究中要深入讨论与尝试的方面.
现代化农业的发展离不开金融体系的支持.普通农户和新型经营主体都有融资需求,只有建立运转健康、资金充足、服务意识强、协调有力、监管到位的农村金融体系,切实解决广大农民和产业主体融资难、融资贵的问题,才能推动各项新型农业产业项目的落实,才能跟上党和国家对农村经济发展战略部署的脚步.随着农村信用社、农业发展银行、邮政储蓄银行等一批正规金融机构的逐步建立,农村金融支持体系的建设初现成效,一定程度上解决了新型经营主体的融资问题,但随着农村产业模式改革和市场进一步发展,这种单一的金融支持体系显然不再适用.到今天,形成
期刊
文章基于2009-2018年中国30个省份的面板数据,利用超效率SBM模型测算省域生态效率,分析其时空演变趋势和空间相关性.在此基础上,构建动态空间杜宾模型探讨高新技术产业集聚对生态效率的时空效应.结果 表明:生态效率具有显著的时间惯性和空间依赖性.高新技术产业集聚对生态效率的影响存在空间溢出效应,且空间溢出效应在时间上存在差异,即短期内高新技术产业集聚与本地生态效率呈“U”型关系,与邻近地区生态效率呈“倒U”型关系;长期内高新技术产业集聚整体上对生态效率具有促进作用,但未形成显著的溢出效应.
隐马尔可夫模型对于异质纵向数据的处理有良好的效果,因此被广泛应用于工程技术、生物医学、经济管理等领域.文章引入了一种特殊的非齐次隐马尔可夫状态转移方式,并将其与经典的多元线性回归相结合,提出了隐非齐次马尔可夫多元线性回归模型,介绍了对该模型进行贝叶斯推断的方法原理和技术细节.最后,通过两个模拟实验说明了推断方法的结果是可靠的.
文章从过度置信度视角考察了广义最小二乘估计量在四分之一轮换面板下产生的偏误问题,并提出了一种稳健估计方法来修正过高的过度置信度,进而提高估计精度.在一定的设计条件下,证明了修正后的估计量具有一致性和渐近正态分布特征等优良性质.模拟研究结果显示,与四分之一轮换面板下广义最小二乘估计量相比,提出的估计方法在保持相对偏差和均方误差基本不变的情况下,有效降低了过度置信度.