稀疏化方法在半参数模型中的若干研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:victor9808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的迅速发展,人们面临着充斥冗余信息且结构复杂的数据,这使得传统统计估计模型和理论不再拥有良好的应用表现。稀疏化方法经过近20年来的发展,对于筛选数据中的重要变量、提升统计模型的可解释性等有重要的促进作用。然而,实际问题中复杂数据的多约束性、非单一性以及高噪声影响,使得传统的基于线性回归的稀疏化方法使用范围受限。我们从经典的稀疏化模型出发,研究了该技巧在部分线性模型中的应用,并进一步探讨了稀疏化方法在高维条件分位数半参数模型平均中的理论与实际表现。在应用稀疏化方法到半参数模型中时,首先考虑了部分线性模型。对于部线性模型中的参数结构,我们使用不同的压缩估计策略研究了压缩估计对于部分线性模型估计效果的影响。通过比较各个策略得到的渐近分布偏度和渐近风险,从理论上给出了不同压缩策略的具体影响。最后,采用SCAD罚函数建立了新的基于差分法的部分线性模型参数的估计模型。数值模拟和案例分析都表稀疏化方法确实可以促进提升传统的部分线性模型的表现。将稀疏方法应用到分位数半参数模型平均问题中前,我们仔细研究了模型平均的理论和计算方法,并讨论了离散响应变量情形下的广义半变系数模型的平稳模型平均方法。首先,我们把广义半变系数模型作为候选子模型。然后,利用交叉验证的方式估计出每个模型相应的权重大小。对于在估计过程中模型反复使用的缺陷,我们设计了一种新的随机分割模型,从而提升模型预测的准确性和平稳性。最后,数据分析结果表明改进的平稳模型平均估计大大增强了新模型的稳健性并显著地减小了模型错误选择的风险。使用稀疏化方法研究高维数据中的半参数模型平均问题发现,已有的方法不能够很好解决具有高噪声的数据预测问题。为此提出了一个带罚项的高维条件分位数半参数模型平均问题。首先,根据一个局部线性回归方法计算每个变量的边际分位数;通过引入边际分位函数的一个放射线性组合,得到响应变量条件分位数的一个近似估计。然后利用非参数的核估计方法,我们采用惩罚函数进行模型权重向量的估计。接着,我们重点考虑稀疏化方法挑选重要的变量,从而降低模型计算的复杂度和成本。利用筛选出的重要变量,估计联合多元条件分位数的具体形式。在计算机数据模拟分析和实际案例测试中,新的模型具有更好的稳健性和更佳的预测效果。
其他文献
随着休闲旅游的发展和特色住宿需求增加,越来越多经营者涌入民宿行业。然而,大多数民宿经营者缺乏专业管理知识,仅凭经验管理民宿。此外,在旅游流动性和资本逐利性的引导下,外地民宿经营者占比更大于本地经营者。他们对地方特色认识较为浅薄、对地方文化的挖掘深度不足,最终导致民宿经营供给与需求的错位,旅游者体验感不佳。民宿与传统住宿的区别体现在,民宿提供基础住宿外,还成为了旅游者参与地方活动的重要媒介。旅游者选
当前,我国经济正由高速增长阶段,逐步转向高质量发展阶段。在更高的发展阶段中,提高全要素生产率将是经济增长最核心的动力。结合我国的经济发展历程来看,改革开放后的四十多年里,我国经济经过了高速经济增长的阶段,相比之下,我国的全要素生产率的增长显得十分缓慢,全要素生产率对经济增长的贡献较低。企业是经济发展的核心单元,社会整体的技术进步提高以及全要素生产率的提升最终需要落实到企业的实际活动中,特别是依靠企
GIS盆式绝缘子绝缘性能劣化是诱发并导致GIS设备故障的重要因素之一。以金属微粒为代表的外部缺陷和气泡/裂纹为代表的内部缺陷会引起微区电场畸变与局部放电,形成复杂电热应力,其致使基材环氧树脂绝缘介质(Epoxy resin insulating dielectric,以下简称为EP)凝聚态微结构的瓦解是盆式绝缘子性能劣化的主要原因。然而由于对EP的分子链破坏机制和绝缘劣化演变规律认知不清,导致目前
我国油气资源消耗量大、对外依存度高,发展地下油气储备是保障国家能源安全的重要手段。因盐岩具有低渗透率、损伤自修复能力等优点,盐岩储库在储存天然气、石油等领域应用广泛。在我国,作为长距离天然气输送管道的配套工程,多个盐岩储库被建设和运行。然而,国内盐矿层多为层状结构,含有大量夹层和杂质,采用传统单井油垫造腔技术建造盐穴时遭遇了许多问题,盐岩储库选址、建设工作进展逐渐趋缓。水平造腔技术能够在有限厚度盐
由液力变矩器作为主要元器件构成的液力传动系统,因其具有柔性传动、低速增扭、对外界载荷自适应调节速比等优点而被广泛应用于乘用、农业、工程、军事等车辆中。然而,液力传动系统传动效率不高。液力变矩器主要依靠工作液体动能的变化传递能量,而且发动机的转矩在液力变矩器处经历了两次能量转换,因此降低了液力传动系统的传动效率。液力式分流传动在一定程度上提升了液力传动系统的传动效率,然而分流传动大大降低了液力变矩器
我国人口老龄化不断加剧,人口结构中老年人快速增加,适龄劳动力人口逐年下降,加上渐进式延迟退休年龄政策的积极推进和出台,这些因素都会导致职场中年长员工的数量和比例不断增长。为了应对年长员工不断增加对企业人力资源管理和经营发展带来的挑战,企业管理者有必要开发年长员工群体。但如何开发年长人力资源?尽管学术界和实践界已经开始探索和实践,仍没有得出行之有效的答案。不可否认,随着年龄的增长,老龄化会给年长员工
本世纪以来,美国次贷风险蔓延而生的金融危机,使各国对金融风险高度关注,2020年的新冠疫情又导致全球金融市场剧烈动荡。我国银保监会一直将防范化解保险业的重大风险作为工作的重心。寿险公司作为我国保险市场的重要主体,其经营风险具有特有的脆弱性和敏感性。引发寿险公司经营风险的因素较为复杂,但由于风险往往蕴含在业务之中,有必要深入研究寿险公司产品集中度与经营风险的关系。从寿险业发展的现实背景来看,当前行业
大年结实(Masting或Mast seeding)为植物周期性的同步结实现象,被认为是许多多年生植物重要的适应性繁殖策略。植物通过大年结实的规模经济效应(Economics of scale)能够提高传粉效率和降低种子捕食,从而提升繁殖效率。最近几十年中,大年结实一直是生态学领域研究的热点问题之一,其格局、形成机制和生态学后果等相关科学问题引起森林生态学家的广泛关注。研究植物大年结实有利于增加对
世界范围内的低碳经济发展和可持续发展极大地推动了燃料电池的发展。镁-空气(Mg-air)电池类似于燃料电池,将镁合金作为“燃料”来产生电能。镁合金的微观组织,包括织构、第二相、晶粒尺寸和孪晶,将在很大程度上影响着Mg-air电池的放电性能。除此之外,在镁合金表面上生成的放电产物也会影响着Mg-air电池的放电性能。本论文以Mg-Li-Al-Zn和Mg-Y合金为研究对象,对基于上述合金的Mg-air
宋代窦汉卿《疮疡经验全书》根据痔的部位、形象、症状分成二十五种类型。肛裂属钩肠痔,由于血热肠燥便秘损伤成裂,疼痛、便血、便秘是其三大主症,而疼痛又是肛裂最难熬的痛苦。我们采刖当归注射液加1%利多卡因基底部注射治疗肛裂114例,效果理想,现报告如下: 一、临床资料 114例中,男86例,女28例;年龄15~56岁;病程4个月~11年。二、药物配剂与操作方法以当归注射液2毫升,1%利多卡因3~5毫升
期刊