高维相依序列样本分位数及回归模型的相关问题研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:surfing203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展,数据收集方式发生了革命性的变化,这使得在金融、经济、临床医学以及生命科学等诸多领域都涌现出了海量高维数据。特别是当数据来自金融和经济学领域时,数据之间的时间相依关系是普遍存在的。大量实证研究表明金融时间序列数据的分布往往是厚尾的。当数据的分布是厚尾的或者均值无穷时,分位数作为描述数据分布的位置的一个重要数字特征,在这类数据的统计推断中发挥着重要作用。近年来,人们对金融时间序列研究中使用基于分位数的方法的兴趣与日俱增,这促使研究者们需要更深刻地理解时间序列样本分位数的统计性质。当观测样本来自时间序列时,其时间相依结构是首要考虑的。马尔科夫链模型可以描述不同系统状态的动态变化,因此被广泛用于时间相依序列的研究中。此外,弱相依混合序列在概率论中经常被用来捕捉随机变量之间的时间相依性,这些弱相依混合序列涵盖了一大类的时间序列模型。鉴于此,本文旨在考虑高维马尔科夫序列以及φ-合序列的样本分位数的收敛速度问题。另一方面,在过去二十年中,用于高维时间序列回归的Lasso方法吸引了许多研究者的注意。然而,当涉及到经济和金融数据的回归时,误差项通常不满足独立同分布假设。因此,本文旨在将经典的含独立同分布误差的高维线性回归模型的Lasso方法扩展到含φ-混合误差序列的高维线性回归模型,并考虑误差分别服从高斯分布和次指数分布下Lasso估计量的收敛速度问题。除了连续型取值的数据,在实际生活中,计数数据也广泛存在于金融、生命科学、临床试验、犯罪学和信号处理等若干领域。随着科学和试验技术的进步,在上述领域中也大量地收集到高维计数数据。众所周知,Poisson回归模型被广泛用于对计数数据的回归分析中。然而,在许多高维计数数据的实际应用中,其协变量可能天然具有一些分组结构。鉴于此,本文旨在研究协变量具有组稀疏性下高维Poisson回归模型的参数估计量及其统计性质。综上所述,围绕着时间相依序列的样本分位数的收敛速度、含φ-混合误差的线性回归模型的Lasso方法,稀疏高维Poisson回归这三个子课题,本文给出的主要结果概述如下:首先,本文分别考虑了当观测序列为时齐马尔科夫序列和φ-混合序列时高维样本分位数的收敛速度问题。当观测序列为时齐马尔科夫序列时,本文首先给出了与其一步转移概率相关的伴随平稳分布,然后基于该伴随平稳分布定义时齐马氏链的分位数以及样本分位数。在一定的条件假设下,利用样本分位数的集中特性和马尔科夫链的性质,本文给出了观测序列为马尔科夫序列时高维样本分位数的集中不等式。当观测序列为φ-混合序列时,本文利用样本分位数和φ-混合序列的集中特性给出其高维样本分位数的收敛速度。此外,除了考虑随机变量服从连续型分布的情况,本文还给出了这两种时间相依观测序列取值为离散型随机变量下高维样本分位数的收敛速率。最后,本文分别从理论和数值模拟上说明了得到的收敛速度比应用其他Hoeffding型不等式的收敛速率更快,并给出了样本分位数在股票市场风险管理中的实证应用。其次,本文探讨了在固定设计下含指数φ-混合误差序列的稀疏线性回归模型Lasso估计量的一致性定理。当误差序列为指数φ-混合序列时,且误差分布分别满足高斯分布以及次指数分布的条件下,本文给出了 Lasso估计量估计误差和预测误差的非渐近集中不等式,同时也证明了 Lasso估计量的一致性。此外,本文分别给出了两个数值模拟试验,第一个模拟结果表明预测均方误差(MSE)随着样本数量的增大而减小,且强信号模型比弱信号模型的预测MSE更小。第二个模拟结果表明,随着样本数量不断增大,Lasso方法能正确选择到参数向量非零参数指标集的概率越大。最后,本文通过实证分析结果表明基于Lasso变量选择构建的指数追踪组合可以密切地追踪沪深300指数的走势。最后,本文考虑了在随机设计下应用加权Group Lasso方法估计高维Poisson回归模型中具有分组稀疏性的参数向量,其中组的数目Gn可以随样本数量n的增大而增大,甚至是n的函数。在一定的假设条件下,本文分别给出了加权Group Lasso估计量的估计误差和预测误差的非渐近Oracle不等式,估计误差和预测误差的上界由正则化系数和稀疏水平来决定,其收敛速率的阶数分别为O(η*(?))以及O(η*log(Gn)/n)。此外,本文应用独立Poisson随机变量加权和的集中不等式给出了加权Group Lasso方法中数据驱动的权重选择,该权重使得加权Group Lasso优化问题的KKT条件在真实参数β*处以很高的概率成立。最后,本文在数值模拟中比较了该权重和其他权重下加权Group Lasso估计的结果,并将这些方法应用在汽车保险索赔数据集的分析中。
其他文献
目的:本研究旨在探讨多巴胺D4受体基因(Dopamine Receptor D4 gene,DRD4)rs1800955单核苷酸多态性(single nucleotide polymorphism,SNP)对注意缺陷多动障碍(attention deficit hyperactivity disorder,ADHD)儿童静息态脑功能的影响,并进一步探索脑功能与工作记忆的相关性,为ADHD病因学研究
学位
目的:描述ICU老年重症患者衰弱患病率,探索衰弱对ICU老年重症患者临床诊疗及短期预后的影响。方法:本研究采取前瞻性研究方法,收集2020年11月至2021年11月于遵义医科大学附属医院重症监护病房治疗的老年患者临床资料,包括ICU老年重症患者的一般人口学特征、合并症、ICU主要诊断、临床衰弱量表(Clinical Frailty Scale,CFS)、Charlson合并症指数(Charlson
学位
目的:本研究旨在探索肺叶切除术后CAP患者的咳嗽程度与肺动脉收缩压改变的相关性,为临床提供干预肺叶切除术后咳嗽的新的策略,以改善患者术后咳嗽症状,为患者提供更好的胸外科术后快速康复体验。方法:前瞻性研究分析成都大学附属医院2020.07-2021.08胸心外科收住的行胸腔镜下肺叶切除术的发生术后持续咳嗽的患者42例。随访并收集患者的基本临床资料、咳嗽评分(VAS及LCQ-MC)以及超声心动图,并将
学位
目的:研究4-BDE对睾丸支持细胞凋亡的影响,探讨Fas/Fasl信号通路在4-BDE诱导睾丸支持细胞凋亡中的相互调控作用机制,为4-BDE导致雄性生殖毒性提供理论与实验依据。方法:1.选取不同浓度的4-BDE染毒大鼠睾丸支持细胞24h,用CCK-8法检测细胞存活率,选取合适的4-BDE浓度(低、中、高浓度组),并设定空白组和DMSO溶剂组;2.流式细胞仪检测Annexin V-FITC/PI双染
学位
茶文化旅游既是文化和旅游活动的融合,也是茶业和旅游两大产业的融合。全域旅游为文旅融合、产业融合提供了有力的政策驱动,推动了旅游业的提质增效。文章探讨了安徽省茶文化旅游发展的优势与不足,从品牌定位、品牌设计和品牌营销三个方面提出了安徽省茶文化旅游品牌构建的路径与策略。
期刊
目的:基于静息态功能磁共振成像(rs-f MRI)研究常规MRI阴性的儿童及青少年特发性全面性癫痫(IGE)脑动态功能网络连接变化,探讨动态功能网络连接指标(时间分数、平均停留时间及转换次数)与临床变量(年龄、病程及智商)之间的相关性,为IGE患者脑功能改变及认知功能障碍提供影像学依据。方法:收集2014年4月至2021年8月就诊于遵义医科大学附属医院儿科门诊及住院部确诊IGE且颅脑常规MRI检查
学位
有机半导体具有质量轻、柔性、分子结构多样易变和可大面积制备的优点。它作为活性层可广泛应用于有机场效应晶体管(Organic Field-Effect Transtistor,OFET)、有机太阳能电池(Organic Photovoltaic,OPV)和有机发光二极管(Organic Light-Emitting Diode,OLED)等领域,因此,备受学术界和商业界的关注。目前,OLED已经商业
学位
深入推进职业教育产教融合,保障产业链上游人力资源供给质量,需要校企协同育人走深、走实。文章从高职院校企业冠名班培养的连锁门店店长胜任力角度,分析店长岗位胜任力不足的表现及原因,对照店长胜任力模型给出了提升校企联合培养的店长胜任力的对策,通过发挥企业—学校双主体作用,高效利用“校中厂”,加强表达与沟通能力培养,强化服务营销意识培养,增加过程性评价指标体系等,尝试对校企协同育人的培养模式和培养质量提出
期刊
浮游植物是水生生态系统的初级生产者和食物链的基础环节,浮游植物的群落结构、丰度、优势种、生物量以及发生水华的范围和强度,都是分析水环境变化的重要指标。南水北调工程对尔王庄水库生态环境的未来影响短期内无法预料,南方物种随水入库的影响亟待进行前瞻性研究和预测。因此,在南水北调水体导入尔王庄水库的初始阶段,研究水库水质和浮游植物现状非常有必要。本研究自2018年3月到12月通过对尔王庄水库浮游植物功能群
学位
目的:通过在小鼠睾丸支持细胞中过表达Foxo1,探究Foxo1在小鼠性腺体细胞的命运维持中发挥的作用。方法:1.利用CRISPR-Cas9技术,将磷酸化位点突变的Foxo1基因插入Rosa26区域,构建Foxo1在睾丸支持细胞中持续性表达的小鼠模型,设置对照组(Control)以及实验组(Foxo1-7mu;Sf1-Cre),每组设置3个生物学重复(n=6)。2.对4M小鼠睾丸组织进行FOXO1与
学位