缺失数据下的非参数回归分析

来源 :浙江大学理学院浙江大学 | 被引量 : 0次 | 上传用户：ab869

【摘要】

：

近年来，由于缺失数据在实际领域中有很强的应用背景，诸如生存分析、可靠性寿命试验、医药追踪试验中产生大量不完全数据等。因此，对缺失数据的统计性质以及缺失数据下的回归问题

【作者】

：

孙静

【机构】

：

浙江大学

【出处】

：

浙江大学理学院浙江大学

【发表日期】

：

2009年期

【关键词】

：

非参数回归渐近均方误差缺失数据核函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，由于缺失数据在实际领域中有很强的应用背景，诸如生存分析、可靠性寿命试验、医药追踪试验中产生大量不完全数据等。因此，对缺失数据的统计性质以及缺失数据下的回归问题进行讨论具有很重要的实际意义。而非参数回归模型在完全数据下的统计性质已经发展得较为完善，相对而言，基于缺失数据下的统计性质的分析是一个历史不长、逐步发展的领域。　　本文在缺失响应变量的情况下，对非参数回归模型进行研究。利用变窗宽局部线性平滑法和稳健的变窗宽局部M—估计法给出了回归函数m(x)的估计。利用变窗宽提高了估计的可塑性，使之更灵活，利用M—估计既继承了线性平滑法的优点，又克服了最小二乘方法缺少稳健性的缺点。　　而在处理缺失数据问题时，本文采用两种方法：一是成对删除法，即把Yi缺失的数据成对删除，利用剩余数据进行非参数回归，称其为简单法，这是实际中最常用韵方法。二是两阶段估计法，由Yates(1933)以最小二乘估计值代替缺失数据值思想启发，利用简单法得到的估计值代替缺失的Yi值，从而形成一个完整数据集，用此数据集进行非参数回归，称其为估算法。　　文章将分别用变窗宽局部线性平滑法和稳健的变窗宽局部M—估计法按上述两种方法处理缺失数据，得到相应的估计函数，并给出它们的渐近均方误差(AMSE)表达式。通过渐近均方误差(AMSE)，可看出核函数和窗宽对估计的作用，并且可以利用最优渐近均方误差比较简单法和估算法，进而得到结论：估算法中，若两个阶段的窗宽不同阶，则简单法优于估算法；若两个阶段的窗宽同阶，当选取适当的核函数时，可得到估算法优于简单法。这样就给实际中处理缺失数据带来一种更好的方法，即两阶段估计法。

其他文献

非线性方程迭代算法的收敛球研究及其分形表示

求解非线性方程是一个非常重要的问题，实际中的许多问题最终都有可能转换成非线性方程f(x)=0的求根问题，这个问题一直都是许多数学工作者研究的重点，而迭代算法是求解这类问题的

学位

非线性方程迭代算法半径估计误差分析分形理论分形图收敛球

无穷区间上的分数阶微分方程边值问题解的存在性

学位

基于无穷范数非光滑优化的光滑化方法

欠定线性方程组的求解问题在图像恢复和重建领域有广泛的应用价值，近年来它逐渐成为国内外学者研究的热点.关于求解欠定线性方程组问题的研究成果也比较多，但是对基于l∞优化问

学位

欠定线性方程组无穷范数非光滑优化改进Breg-man迭代算法稀疏表示图像重建

基于EVOC-EPE总线的工控机特性及可靠性分析

主要讨论了在工业控制计算机领域,EVOC-EPE主控板增强PCI Express系统总线相比较于原有PICMG1.3主控板系统PCI Express总线规范的优势,从总线扩展性、结构稳定性、系统可靠性

期刊

EVOC-EPE总线EVOC-EPE总线易维护性工控机信号完整性易扩展性电磁兼容性工业控制计算机可靠性分析

小学语文教学中存在的问题及其解决对策分析

语文是小学阶段最重要的课程之一,奠定学生一生的语言基础.语文教学效果在国家、学校和教师的努力下不断提高,但依然存在部分问题影响课堂效率的充分发挥.笔者结合自己多年的

期刊

语文教学对策

最小二乘双支持向量机的两种拓展及其在线学习算法研究

最小二乘双支持向量机是在传统双支持向量机模型的基础上将二次规划问题修改为最小二乘形式得到的,该模型只需求解两个线性方程.最小二乘双支持向量机在取得理想分类精度的同

学位

支持向量机双支持向量机最小二乘双支持向量机双重加权机制剪切机制在线学习算法

带有可信性服务水平的模糊生产计划问题的研究

生产计划是在特定时间内对生产任务和进度的计划和安排。在现实生产计划中,由于测量误差和数据噪声,生产计划的参数往往具有模糊性,这时我们就需要使用一套处理模糊不确定性的工具来研究生产计划问题。本文正是基于可信性理论对带有可信性服务水平的模糊生产计划问题进行了研究。本文首先建立了一类带有可信性服务水平的模糊期望值生产计划模型。当需求为相互独立的正态模糊变量时,该模型可以转化为具有确定约束条件的等价问题。

学位

生产计划可信性理论逼近方法粒子群算法可信性服务水平

两类立方体的诊断度

诊断度是系统能够保证不可替换地被诊断出的故障处理器的最大数目,它在衡量互连网络的可靠性和容错性方面起着重要的作用.系统中通过限制任何一个故障集都不能包含任意一个处

学位

互连网络诊断度超立方体折叠超立方体PMC模型MM模型

DtN重构算法的有效性分析

本文主要研究了以声波导为背景的Helmholtz方程，用DtN重构算法步进计算波的传播性态的有效性问题。对于含有弯曲内部界面的声波导，首先需要进行坐标变换，将波导中弯曲的界面拉直

学位

声波导Helmholtz方程坐标变换算子离散DtN重构算法误差分析界面函数

浅析高职类国际贸易专业的教学实践改革

我国是进出口贸易大国,每年对国贸专业的学生有很大的人才需求量。作为高职类的国贸专业具有自身的教学特点,本文就结合自身的工作经验和教学实践,根据高职教育本身的特点,分

期刊

国贸专业教学改革高职类国际贸易专业高职教育贸易专业人才高等职业教育进出口贸易双证制人才需求量

缺失数据下的非参数回归分析

与本文相关的学术论文