响应变量随机缺失下部分变系数单指标模型的变量选择

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:xumeg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分变系数单指标模型是一个半参数模型,它结合了变系数模型和单指标模型的优点。然而,在实际应用中,当协变量维数比较大时,会使得回归方程包含某些对响应变量影响很小甚至没有影响的协变量,从而导致对响应变量预测的精度下降和模型中参数的估计具有偏差。因此,统计建模时,如何识别协变量对模型的重要性,挑选重要的协变量进行建模是统计研究的一个重要课题。模型的变量选择可以简化模型从而降低或避免参数回归分析中的“维数祸根”风险,而且也有利于模型的预测。因此,本文将利用B样条和SCAD(SmoothlyClippedAbsoluteDeviation)惩罚相结合的方法研究响应变量随机缺失下部分变系数单指标模型的变量选择。
  本文的前两章简要介绍了本文的选题背景和研究现状以及预备知识。
  第三章使用基函数展开和SCAD惩罚方法相结合,提出一种有效的变量选择方法。首先,基于完全观测数据(忽略有缺失的数据),使用B样条基函数对未知的变系数函数θ(·)和联系函数g(·)进行展开;其次,结合模型的可识别条件‖β‖=1,采用Yu和Reppe提出的“去一分量”方法构造惩罚估计方程;然后,为了提高参数的估计效率,采用Zhou和Wang的方法对缺失数据进行插补;最后,用交叉验证的方法选取模型中的调整参数和样条的节点数,对于惩罚估计量的计算给出了一个逐步迭代的算法。在适当的选择样条的节点数和调整参数的条件下,得到了变系数函数θ(·)和单指标参数?的正则性估计量以及它们的收敛速率,并给出了它们的证明。
  第四章,在响应变量随机缺失的机制下,从样本容量、缺失概率、协变量U的三种概率函数方面进行数值模拟,使用三种不同的估计方法:基于完全观测数据集(忽略有缺失的数据)的SCAD方法、基于插补数据集的SCAD方法、基于完整数据集(没有数据缺失)的SCAD方法,对单指标参数β和变系数函数θ(·)的被正确识别的个数、单指标参数β的广义均方误差(GMSE)、变系数函θ数(·)的根均方误差(RASE)分别进行了比较。模拟结果表明,在有限样本的情况下,基于插补数据集的SCAD方法正确识别单指标参数β和变系数函数θ(·)的个数都要高于基于完全观测数据集(忽略有缺失的数据)的SCAD方法;基于完整数据集(没有数据缺失)的SCAD方法中单指标参数β的广义均方误差和变系数函数θ(·)的根均方误差都比较小;随着缺失概率的增加,两种方法的性能差别越来越大。当样本容量增加时,基于完整数据集(没有数据缺失)的SCAD方法的结果越来越接近基于完整数据集(没有数据缺失)的SCAD方法。
其他文献
近年来,随着社会的迅速发展,互联网被视为一种高效的沟通媒介,特别是以移动通信设备为载体的新媒体正以势不可挡的势头渗入到人们生活的方方面面,青少年逐渐成为使用新媒体的主体。新媒体的急速发展,对青少年的影响尤为深刻,在为青少年提供便利的同时,也产生不可估量的负面影响。因此,如何监管青少年对新媒体的使用,提高青少年识别和判断新媒体信息的能力,并使新媒体发挥积极作用,是当前基础教育迫在眉睫的任务,也是家庭
学位
诚信是社会主义核心价值观的要素之一,没有诚信,人无以立身,国无以立本,社会无以存续。科学技术是现代社会发展的强劲动力,因而,拥有数量庞大的科技人才是我国市场经济发展、实现自主创新,尤其是实现强起来的前提与基础。虽然国务院于2014年印发了《社会信用体系建设规划纲要(2014—2020年)》,2016年印发了《关于加强个人诚信体系建设的指导意见》,但是,在近些年的实践中,常常发现各种类型的社会公共失
学位
根据商务部公布的数据显示,2019年中国实际利用外资9415.2亿元,比上年增长5.8%,新设外资企业4.1万家,投资来源地国家和地区达到179个。吸引利用外资历来就是我国促进对外开放的重要途径之一,科学利用外资项目不仅能够对区域经济发展起到全方位带动作用,更有利于加快国家整体经济发展速度。面对传统的发展路径与全面扩大开放的发展要求之间的新旧冲突,外资项目如何能在新形势与新变化中促进地方经济高质量
当前我国警务战略正处于改革的攻坚阶段和发展的关键时期,而社区警务又是警务战略改革的主要方向,其目的是提高警务工作的整体效率,强化公安机关依法维护社会正常秩序、化解社会矛盾、预防及打击违法犯罪活动,同时,对社会治安防控体系的构建和完善,乃至推进社会、社区的治理创新也起到了非常积极的作用。上海市虽在多年前就已开展社区警务战略,但随着复合型城市的高速发展,社会治安防控风险、难度加大,治安形势日益复杂,上
学位
财政资金的投入,在扶贫工作中起着至关重要的作用。“资金使用精准”作为我国精准扶贫工作的“六个精准”基本方略之一,更是对财政涉农资金的合理使用提出了更高的要求。长期以来,我国财政涉农资金的投入模式都是由上级政府多部门多头投入,基层并没有项目安排和资金使用的自主权,且财政专项资金本身的使用范围有严格的规定,这些因素往往导致财政专项资金在到达基层之后与当地实际项目执行情况脱节,致使财政资金使用的效率和效
学位
随着国际经济全球化的进展,科技与经济一体化的加速,社会生产方式的变革以及人民生活水平和文化素质的提高,无不是由科技进步的日新月异为主导的。科技在推动经济社会快速发展的同时,正在逐渐以多形态方式参与到区域竞争与发展中,在此过程中,科技创新能力的高低已经逐渐成为地方竞争力的重要体现。科技创新能力的提高需要不断的科技创新活动的进行,而科技创新支撑体系作为包含所有直接或间接参与科技创新活动的运行系统,决定
虚拟经济与实体经济两种经济形态及其关系构成了现代经济体系的新格局。虚拟经济以实体经济为基础,自身具有独立运行规律,又与实体经济密切联系,二者互相促进、共同发展。虚拟资本自产生以来发展迅速,20世纪中后期以后更是以一种加速度的趋势膨胀发展。虚拟资本的发展与金融市场的不断发展密切相关。但自1997年7月东南亚金融危机后,虚拟经济对实体经济的偏离、脱节等问题引起了我国学术界和有关部门的关注。特别是200
学位
辽宁省医疗器械产业发展已初具规模,以沈阳东软医疗、欧姆龙等为代表的龙头企业已成为高端生物产品研发的主力军,但近年来相比发达省份其产业竞争力有下降趋势,研究如何提升其医疗器械产业竞争力,对辽宁省开拓产业发展新格局及产业结构转型具有重要的现实意义。本文以钻石模型为基础,综合分析了辽宁省医疗器械产业发展现状,并以此构建了较为完整的医疗器械产业竞争力评价指标体系。依据我国医疗器械产业布局现状,选取了有代表
学位
伴随城镇化和工业化快速发展,我国耕地资源减少,越来越多的涉农企业投向海外发展。农业国际化进程加快促使农业国际投资与农产品贸易的联系愈加紧密,研究对外农业直接投资与农产品出口之间的关系,对我国农业深度融入国际市场具有深远的现实意义。为了探究对外农业直接投资对我国农产品出口的影响,在对已有文献进行梳理的基础上,从贸易创造效应和贸易替代效应两个方面定性分析对外农业直接投资影响农产品出口的途径,并通过建立
高新技术产业创新效率的高低直接影响高新技术产业的发展,并且高新技术产业发展常呈现集聚特点。保定市高新技术产业在一定空间上呈现集聚特点,创新效率与规模的快速扩张不相适应。这种量在空间上的集聚能否切实带来高新技术产业创新效率的提升,成为当前亟需解决的问题。因而以保定市高新技术产业为研究对象,通过区位熵和随机前沿方法对产业集聚和创新效率进行测度,采用面板计量模型研究高新技术产业集聚对创新效率的影响。研究