高维回归模型的系数检验及其应用

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:tanya_33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的高速发展,各领域呈现出各种复杂数据,比如缺失数据、删失数据、截断数据、高维数据.高维数据的出现不仅带来了大量的有效信息,也为统计学的发展带来了新的机遇.当协变量的维数p固定,且样本量n较大时,传统的统计方法表现的非常好.然而在高维数据下,经典的统计推断理论可能失效.因此,在高维数据下,如何做统计推断一直是学者们关注的热点.本文主要研究了高维回归模型系数的检验问题.图或网络是描述信息的常用方式,特别是在生物学中,许多不同的生物过程可用图来表示,如新陈代谢途径.结合生物网络或图信息,第二章研究了高维下线性模型单个回归系数的统计推断.首先,基于L1惩罚函数和拉普拉斯(Laplacian)矩阵构造出单个回归系数的无偏估计,并得到其渐近分布.其次,与现有的方法相比,数值模拟结果表明本章所提出的方法优于其它方法.最后,将本章所提出的纠偏方法应用到人类肝脏队列数据集中,与其它方法相比,本章提出的方法能够高效的识别出有效的基因.线性模型虽然简单,但在实际中,数据之间往往存在非线性关系.为同时刻画线性和非线性关系,学者们提出了部分线性模型.当线性部分的协变量维数p发散时,第三章研究了高维部分线性模型中参数部分的全局系数检验问题.首先,在原假设下,本章利用多项式样条估计未知函数.其次,基于原假设下得分的期望为零,我们构造了 U-type检验统计量,并得到了该统计量在原假设和局部备择假设下的渐近分布.数值模拟表明,在不同的设置下,本章所提出的检验统计量都表现的非常好.另外,即使在错误模型下,该检验统计量也能区分原假设和备择假设.最后,将本章所提出的方法应用到乳腺癌数据中,结果表明本章提出的检验统计量能够更有效的识别有用的变量.前面两章都是假设误差是独立同分布的,然而实际数据中,特别是金融数据,往往存在异方差.为此第四章,针对高维Expectile线性回归模型,研究了回归系数的全局检验和局部检验问题.在原假设下,类似于第三章的构造方法,我们构造了 U-type检验统计量.理论上,在一定的条件下,基于鞅的中心极限定理,在原假设和局部备择假设下,我们得到了本章所提出的检验统计量的极限分布.数值模拟表明本章所提出的检验统计量能够有效的区分原假设和备择假设,特别是在非稀疏的情况下.最后,将本章所提出的方法应用于股票收益数据中,结果表明高维线性模型难以刻画协变量与响应变量之间的关系.
其他文献
2018年6月1日,A股正式纳入MSCI指数,初始纳入比例2.5%,并在之后逐步提高。海外资金的流入是否会影响调入股票的价格,即A股是否存显著的调入效应,又重新引起了学者和从业者的
研究栽培稻抽穗期多样性的形成及进化机制,对揭示栽培稻区域适应性、扩大种植范围具有重要的指导意义。前人研究表明栽培稻长日抑制基因对抽穗期多样性具有重要影响,但目前仍
大规模MIMO(Multiple-Input Multiple-Output)技术能够提高数据传输速率、增强系统可靠性、降低能耗,从而成为下一代移动通信关注的重点技术之一。分布式天线技术能够提高频
具有良好相关性、平衡性和高线性复杂度的理想序列偶主要应用于雷达、声纳、导航、同步、电子对抗、遥测遥控、信息加密、编码孔径成像等众多工程领域。然而,直接构造理想序
林侗遊歷各地,蒐拓古碑達三十餘年,兩次易稿,以近十年之功完成《來齋金石刻考略》一書。其“搜羅廣博,鑒别尚頗詳審”,著錄金石碑版時,注重參稽群籍,在諸多領域對所收金石文
随着移动通信的快速发展,人们对通信服务的需求量日益增长,未来5G网络中移动数据流量业务需求会增长1000倍。面对这样爆炸式的通信量增长,如何提高无线通信网络系统性能将成
随着化石燃料资源日渐短缺,生态环境不断恶化,寻找和开发低成本、清洁的可再生能源以及研究高效的能量储存系统已经成为社会亟待解决的首要问题。超级电容器是一种新型的能源
血吸虫病是一种慢性消耗性寄生虫病,严重影响发展中国家的公共卫生安全。日本血吸虫病在我国南方广泛流行,对人民身体健康和畜牧业生产等造成了重大损害。血吸虫具有免疫逃避
近年来,随着科技不断发展,眼镜式显示器也走进了人们的生活当中,受到广泛关注。眼镜式显示器作为一款新型显示设备,已被广泛应用于娱乐、医疗、工业生产等领域中。然而,目前
徐家围子断陷是松辽盆地北部断陷群中的一个断陷,近年的勘探研究工作表明,徐家围子断陷地层广泛发育且钻探显示多层系含气,该区为伸展裂陷盆地,凹陷的分割性强并各有自己的沉