【摘 要】
:
一般的回归模型,通常假设解释变量的观测不含有误差,然而在很多领域的实际问题中,解释变量往往含有测量误差。如果忽略测量误差的影响,可能会使统计推断出现巨大偏差,得出的
论文部分内容阅读
一般的回归模型,通常假设解释变量的观测不含有误差,然而在很多领域的实际问题中,解释变量往往含有测量误差。如果忽略测量误差的影响,可能会使统计推断出现巨大偏差,得出的结论与真实情况出入较大,因而近年来,测量误差问题方面的研究受到广泛关注。另一方面,可加模型因其不受函数形式限制的灵活性,常被应用于多类问题中。本文研究的重点,即是在可加模型的框架下,考虑存在测量误差问题时如何进行模型估计以及变量选择。首先文章基于现有的研究情况,简单总结了测量误差模型的基本概念和基本方法,进而介绍了处理部分线性测量误差模型的思想。为了将这一思想进行推广,文章补充了B样条和群组变量选择的理论基础。然后在此之上进行了灵活应用,在含测量误差的可加模型中使用了B样条基拟合,将非参数模型转变为线性形式。接着结合最小二乘方法构造了新的目标函数,同时重新定义其中的变量使问题简化,并利用泰勒展开方法进行了推导,从而完成了式子的化简以及对测量误差的修正。最后加上惩罚项进行群组变量选择,通过坐标下降算法迭代求解。之后通过一系列的模拟研究,分别在自变量之间是否存在相关性,还有因变量是否对自变量的变化敏感的情况下,从模型估计精确度和变量选择准确度两个方面,对是否修正了测量误差的模型,以及不同的群组变量选择方法进行了对比。模拟结果表明,使用了本文所提出的误差校准和群组变量选择方法处理可加模型中的测量误差和变量选择问题,得到的模型的估计精度有所改进,同时有利于正确选择有效变量以及剔除无关变量,且群组SCAD方法整体优于群组Lasso。最后将本文的方法应用到了一份自变量存在测量误差的实际数据中,在进行变量选择的同时建立了脂肪中的热量关于各自变量的可加模型。
其他文献
车云网(Vehicular Cloud Networks,VCN)是近几年随着车联网和云计算发展而发展起来的新兴技术。在车云网中,车辆及其基础设施的存储、计算等资源将被整合到虚拟资源池中,云系
野鸟一直被认为是禽流感病毒(Avian influenza virus,AIV)的自然宿主。野鸟在众多亚型AIV的保存、传播和变异中发挥极其重要的作用。从家禽以及包括人等哺乳动物体内分离到的
复杂系统可以通过复杂网络的形式来模拟,其原理是将网络中的对象抽象为节点,对象之间的某种关系作为边,进而分析网络整体或部分的统计特性以探究复杂系统的性质。国际股票市
弧形钢闸门支承钢梁结构综合了钢梁抗振性能好、装配准确快速和深梁式支承形式能有效改善闸墩和支承体受力状态的优点,这种支承形式能充分发挥钢材高强、抗拉性能好等优势,还
本次试验采用盆栽沙培方式,研究了不同浓度(0、5、25、50、100mg/kg)的铝(Al)处理下,对多年生黑麦草生理生化和矿质营养元素吸收与累积的影响,以及施用不同浓度(0.2、0.4、0.8和2m
随着电子设备无线充电、电动汽车无线充电逐渐进入大众的视野与生活,无线电能传输受到了越来越广泛的关注。相对于有线电能传输,无线电能传输具有安全性高、灵活便捷等优势,
红区荧光探针抗干扰能力强,荧光穿透纵深大,在定量分析和分子成像领域应用广泛。基于分子组装原理的离子缔合物荧光探针易于制备,避免了化学合成探针的复杂性以及合成过程中
为探究城市供水管网独立计量分区(District Metering Area,DMA)建设过程中形成的分区截断管道和滞流区对供水管网水质的潜在影响,以管龄为9a的实际供水管道为研究对象,设计并
由橡胶粉孢(Oidium heveae B A. Steinmann,O. heveae)侵染导致的白粉菌是我国橡胶树的最重要病害,其导致严重的干胶产量损失。O. eveae为专性寄生菌,不能直接进行遗传转化操
在哺乳动物生殖过程中,胚胎植入到母体子宫中是不可或缺的一步。胚胎植入异常会引起一系列不利于妊娠的涟漪反应,最终导致有害的妊娠结果如胎儿发育缺陷、流产、不孕等。在胚