复杂数据下部分线性变系数模型的变量选择

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:ljhhck123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对部分线性变系数模型,研究参数分量的变量选择。该模型既含有线性模型作为参数分量,又含有变系数模型作为非参数函数,是两者的结合。在理论研究和实际数据分析中,经常会遇到诸如缺失数据、测量误差数据和纵向数据等复杂数据。变量选择可以从众多的潜变量中筛选出重要变量的同时,给出未知参数向量的估计。因此,在复杂数据下研究部分线性变系数模型的变量选择具有一定的理论和实际意义。本文主要研究内容有:(1)在因变量缺失时,研究了高维数据下非参数部分带有测量误差的部分线性变系数模型的变量选择问题。基于局部偏差修正的剖面最小二乘方法和SCAD惩罚函数,分别提出了完全数据和借补方法下的两种变量选择方法。在一定的假设条件下,建立了参数估计量的一致性、稀疏性和渐近正态性等大样本性质。模拟实验表明了所提两种变量选择方法的有效性,且借补方法是优于完全数据的。(2)在纵向数据下,研究了非参数部分带有测量误差的部分线性变系数模型的变量选择问题。基于B样条基函数,对模型中的变系数函数逼近,建立了偏差修正的广义估计方程,构造了偏差修正的惩罚二次推断目标函数,提出了变量选择方法。在一定的假设条件下,证明了非参数估计量的一致性、参数估计量的稀疏性和渐近正态性等渐近性质。模拟实验结果表明了所提偏差修正的变量选择方法的有效性。
其他文献
用水量持续增加和地表径流减少,使地下水资源过度开发,导致部分区域形成了超采区。为遏制地下水超采区面积的进一步扩大,本文以咸阳市为典型区域,通过分析地下水动态变化特征,建立三维可视化地下水数值模型,模拟不同补给条件和开采条件下的地下水位动态变化规律,并模拟预测了该地区近期(2025年)和中远期(2035年)的地下水动态变化过程。得到以下研究结论:(1)揭示了咸阳市地下水位年内与年际的动态变化规律。结
二维GaN具有较宽的带隙、优异的光电特性和良好的热力学稳定性,在光电子器件、自旋半导体器件、气体传感器件以及高功率器件等方面具备广阔的应用前景。目前,二维GaN是二维材料研究领域的一个热点。本文基于第一性原理分别研究了 g-GaN/C60异质结和CO、H2S和NO三种有毒气体分子吸附碱金属掺杂g-GaN的电子和光学特性;研究了用化学气相沉积法制备GaN纳米片。本文的研究内容主要如下:第一,g-Ga
压电材料是一种可在施加外部应力时产生电信号或在外加电场时产生应变的一种材料。这种固有的机-电耦合效应使得压电材料在工程中得到了广泛的应用。而且随着社会发展,人们对环境保护日益重视,高性能无铅压电陶瓷有望取代铅基压电陶瓷在日常生活以及在新兴科技中逐渐获得广泛应用。钛酸铋钠是一种常见的无铅压电陶瓷材料,具有三方钙钛矿结构。由于其剩余极化强度较高(Pr=38 μC/cm2)而被广泛研究,但由于纯Bi0.
在数论中,解析数论是以解析的方法作为研究工具的一个数论分支,它以解析的方法让一些困难的问题迎刃而解。例如,初等数论中同余方程的相关问题可以转化为求解析数论中特征和的上界。随着大数据时代的发展,数论中的一些理论被广泛地应用到了信息安全等领域。在密码学中,有些密钥伪随机性的证明往往等价于证明其对应序列的均匀分布性,均匀分布性又可以转化为证明解析数论中特征和或者指数和的上界得到。因此,许多问题都和指数和
大气浓度是空间环境的重要参量,大气浓度是对全球大气物理和全球环境变化具有重要影响的参数,对地球上空中高层大气浓度的研究和探测能更好理解大气的变化规律。本文对高层大气气辉粒子的浓度与气辉体发射率进行了理论和模拟研究,使用课题组研发的地基气辉成像干涉仪GBAII(Ground based airglow imaging interferometer)样机进行了多次室外实验探测,验证了理论分析。本文首先
类石墨烯氮化碳(g-C3N4)是一种新型非金属半导体材料,具有可见光响应强、热稳定性和化学稳定性高等优点,在水分解制氢、降解有机物、气体传感和二氧化碳还原等领域具有极大的应用潜力。本文制备了二维g-C3N4纳米材料及其复合材料,并对其光催化降解有机物进行了研究;基于第一性原理研究了 g-C3N4吸附体系的电子特性以及光学和磁学性质。主要研究内容如下:本文采用两步法(热聚合法和液相超声剥离法)制备二
在气候变化和人类活动双重作用下,全球性环境恶化以及水资源短缺,与人类生存密切相关的干旱问题已经引起众多国家和地区的关注。以径流为主要研究要素的水文干旱呈现出非线性、非平稳性和复杂性,构建高精度的预测模型是水文干旱研究的热点和难点。有效识别水文干旱规律以及准确预测水文干旱,将有助于减缓水文干旱对区域社会经济发展产生的不利影响,对流域水资源合理配置以及防旱抗旱起着重要作用。论文以中国半干旱区的渭河流域
根据省市政协部署要求,江阴市政协积极推进"有事好商量"协商议事工作。经过探索实践,逐步形成了融履职党支部、委员工作室、协商议事室、社情民意联系点"四合一"协商议事工作模式。一、以"三动"为抓手全方位打造协商平台高位推动。中共江阴市委专门下发《关于充分发挥人民政协专门协商机构作用推动政协协商与基层协商有效衔接的实施意见》,
期刊
由于工业系统所包含的元件数量不断增加,其结构复杂性也不断提高,从而导致元件失效的概率越来越高。元件的失效可能会导致系统失效,由此带来难以估计的经济损失,在现实生活中,多数系统具有多阶段性,所以多阶段任务系统可靠性研究一直受到社会的广泛关注。然而,现有的多阶段任务系统可靠性评估方法大多存在收敛速度慢和计算精度低的问题,因此本文以概率共因失效多阶段任务系统为研究对象,针对其可靠性评估与优化展开研究。首
在统计学中,正态分布无疑是应用最为广泛的分布之一,但人们发现许多金融、气象数据通常会呈现出一定的偏斜特性,并不严格服从正态分布。1985年,Azzalini提出了偏正态分布并表明它能对偏斜数据进行更精确的拟合,该分布自提出后受到了学者的广泛关注。自此,偏slash分布在此基础上被提出并逐渐发展起来,由于其具有比偏正态分布尾部更厚的特性,所以经常用于厚尾金融数据的模型拟合中。为了更准确的描述数据特征