乘积模型若干变量选择方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jiafeicp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经济金融和生物医学等领域的数据分析中,需要处理的响应变量往往取值为正.由于乘积回归模型其响应变量是非负的,成为研究这类数据集的重要统计模型.乘积回归模型又称加速失效时间模型(AFT),是生存分析的重要研究对象.乘积回归模型不仅可以研究协变量是向量的形式,同时也可以处理协变量是函数型的数据.回归模型一般以绝对误差为基础,建立估计方法,研究理论性质.然而在一些实际应用中,比如金融数据,人们往往更关心相对误差.因而基于乘积回归模型研究相对误差估计成为新近发展起来的热门研究方法之一.本文以相对误差为准则,研究了维数发散的协变量为向量形式的乘积模型以及具有局部稀疏性的协变量为函数形式的乘积模型的参数估计和变量选择问题.第二章在协变量为标量的形式下,我们研究回归参数维数发散的乘积回归模型.在这类乘积模型中,假设只有一小部分解释变量对响应变量有重要贡献.以最小绝对相对误差(LARE)准则和乘积回归模型的M估计为基础,我们提出了惩罚M-最小绝对相对误差(惩罚M-LARE)准则,在一定正则条件下,证明了惩罚M-LARE估计能同时剔除贡献不大的解释变量,又得到贡献显著的变量的相合性和oracle性质.通过数值模拟和波士顿房屋的实例分析展示了所提方法的优异表现.在第三章中,我们提出了惩罚M-最小乘积相对误差(惩罚M-LPRE)准则.由于LARE准则的目标函数不光滑,在理论分析和实际计算中有一定的困难.因而本章采用了光滑的LPRE准则,LPRE的目标函数是严格凸且光滑的,这使它在理论分析和实际计算中展现出了巨大的优势.我们在第三章证明了惩罚M-LPRE估计有oracle性质.惩罚M-LPRE估计与惩罚M-LARE准则有相似的渐近表现,但与后者相比,惩罚M-LPRE准则理论分析不仅所需要的正则条件弱一些,而且估计的渐近方差与随机误差密度函数的具体取值无关.我们应用所提出的惩罚M-LPRE准则分别分析了波士顿房屋和身体脂肪数据集.我们在第四章假设协变量是函数形式,讨论了函数型乘积回归模型的相对误差估计问题.本章考虑的参数函数假设满足局部稀疏性,此性质是参数向量形式稀疏性的无穷维表现.为研究这类函数型模型的变量选择,我们综合使用函数型相对误差,光滑样条惩罚泛函和函数型SCAD惩罚函数等思想和方法,并利用B-样条基展开的技巧,提出了函数惩罚光滑最小绝对相对误差(FPSLARE)准则.当模型满足一些正则性条件,理论结果说明FPSLARE估计不仅可估计参数回归函数,还可识别对响应变量贡献不大的区间.求解FPSLARE准则是无穷维的非线性最优化问题.通过B-样条基展开,我们将该问题约化为有限维非线性优化问题.为求解非线性优化问题,本文利用了最小二乘法的线性逼近方法,可将问题进一步简化为线性问题,从而求解了实际问题.通过实验模拟,我们说明参数函数的光滑性和局部稀疏性的假设是建模不能去掉的条件.当参数满足局部稀疏性,本文仿真说明FPSLARE估计有良好的表现.最后,通过加拿大天气预报及Tecator数据集,验证了所提出模型和具体算法的有效性和准确性.
其他文献
金刚石是碳原子构成的晶体。因其卓越的物理性质,金刚石在国防科工、生产生活等各个领域都发挥着重要作用。随着近现代量子科技的发展,金刚石中的氮-空位色心也已成为量子精密测量领域的研究热点。氮-空位色心是金刚石中一种稳定存在的点缺陷,作为固态自旋体系,它具有低温和室温下相干时间长、体积小、可以用激光和微波实现量子态操控与读出的优异特点。在基于氮-空位色心系综的量子精密测量中,金刚石氮-空位色心系综传感器
学位
在凝聚态物理中,由电荷、自旋、轨道以及晶格自由度对称性破缺导致的各种电子有序态,如电荷或自旋密度波,轨道或价键有序以及电子向列有序等,被发现广泛存在于各种强关联材料以及其它一些复杂材料体系当中。大量的研究表明,这些电子有序态与多种宏观物理现象,如巨磁电阻效应,莫特金属-绝缘体转变以及高温超导电性等有着密切的联系。尤其是这些电子态与超导电性之间的共存或竞争关系,使得对这些电子有序态的物理机理研究,不
学位
量子色动力学(QCD)是描述夸克和胶子之间强相互作用的规范量子场理论。根据格点量子色动力学计算,在高温或高重子化学势的条件下会发生从强子态到夸克胶子等离子体(Quark-Gluon Plasma,QGP)的相变。在夸克胶子等离子体中夸克和胶子解除色禁闭,可以在更大的空间尺度达到渐近自由的状态。对夸克胶子等离子体性质的研究是高能核物理领域的重要课题。位于布鲁克海文国家实验室(BNL)的相对论重离子对
学位
聚肽是蛋白质的类似物,具有生物相容性、生物降解性和刺激响应性。迄今为止,通过α-氨基酸-N-羧酸酐(NCA)聚合制备具有精准末端官能团和窄分布系数(D,Mw/Mn)的聚肽仍然面临一些重大挑战。虽然伯胺引发的NCA聚合主要通过常规胺机理(NAM)进行,但引发剂自身的碱性(pKa~10-12)也会导致基于活化单体机理(AMM)的副反应。增长链末端的伯胺基团也与副反应有关,例如其与溶剂(DMF、DMAc
学位
由于细胞具有对其周围机械环境做出反应的能力,所以细胞的生物学行为可以通过基质的机械特性来引导。而基质的刚度作为最重要的机械特性之一在很大程度上会影响细胞的生物学行为,例如:铺展、形态、迁移、增殖和分化。并且绝大多数的细胞生物过程都伴随着周围基质刚度的动态变化,例如生长,发育、衰老、纤维化、癌变以及凋亡等。因此建立刚度动态可调的细胞培养基质以模拟体内动态力学环境来研究这些生物过程是十分必要的。磁纳米
学位
Higgs粒子的发现开启了粒子物理的新篇章,精确测量Higgs粒子的属性成为了当前粒子物理最为迫切的任务之一,因此正负电子Higgs工厂被普遍认为是目前世界上最应该建造的下一代对撞机。环形正负电子对撞机(CEPC)是由中国粒子物理学界提出的一个Higgs工厂计划,其物理目标对探测器性能提出了严格的要求,尤其是要求喷注能量分辨达到30%/(?),这比目前已有探测器的最好性能好两倍。为了满足这一性能要
学位
本篇论文工作利用欧洲核子研究中心(CERN)ATLAS探测器在2015-2018年间收集到的大型强子对撞机(LHC)上的质子质子对撞数据,基于双轻子和丢失横能量末态进行新物理的寻找工作。LHC是当前世界上能量最高,规模最大的粒子对撞实验。在2015-2018年间,LHC产生了大量质心能量为13 TeV的质子质子对撞事例,而ATLAS探测器作为工作在LHC上的几大探测器之一,在此期间收集到了总亮度为
学位
近一个世纪的天文观测,使暗物质成为了现代基础物理学的一个重要问题。虽然有众多的观测支持,但几乎所有关于暗物质存在的证据都来自引力效应。人们提出了很多暗物质的理论猜想,但对暗物质的确切认知接近空白。为了找寻暗物质,回答暗物质究竟是什么这个问题,粒子物理学家尝试在地下低本底环境探测暗物质与普通物质发生相互作用的信号,在加速器上找寻人工产生暗物质粒子的迹象,在宇宙线中找寻暗物质粒子的湮没产物。随着暗物质
学位
2012年大型强子对撞机(LHC)实验发现Higgs玻色子,使得粒子物理领域的标准模型获得了前所未有的成功。标准模型不但在实验上验证了其所预测的全部基本粒子,并且成功的解释了大量的实验数据。即便如此,自然界仍存在一系列基本的科学问题无法得到合理解释,如宇宙中物质与反物质的不对称性、不同代基本粒子的质量等级差异、暗物质和暗能量的本质等。由此,标准模型被认为并非是物理学家们追寻的最终理论,自然界必然存
学位
人类基因组大约含有20000多个编码蛋白质的基因,然而它们只占约2%的序列。基因组中98%的非蛋白质编码序列也被称为非编码区,其中绝大部分可以被转录为非编码RNA,它们构成了物种之间最主要的差别。由DNA、蛋白质、非编码RNA和小分子组成的分子调控网络蕴含着生命活动的基本规律,决定了细胞的命运。目前已知有大量疾病相关的突变都发生在非编码区。与非编码RNA相关的研究处于生命科学的前沿领域,充分体现了
学位