【摘 要】
:
随着科学技术的提高,使得现今采集海量和高维数据成为可能.如何高效快速地从高维和海量的数据集中,提取出有用信息越来越受到人们的关注.同时,所采集的数据中必然包含大量冗
论文部分内容阅读
随着科学技术的提高,使得现今采集海量和高维数据成为可能.如何高效快速地从高维和海量的数据集中,提取出有用信息越来越受到人们的关注.同时,所采集的数据中必然包含大量冗余信息.变量选择研究如何从冗余变量中选择出最重要的因素.因此变量选择是统计中研究的最基本问题,具有非常重要的地位.传统的变量选择往往需要解一个NP难问题,在处理高维、海量数据时失效,并且不够稳健,因此,对于高维的情形,我们寻找新的变量选择方法来解决它—高维稳健估计和图模型.本论文分别开展上述两问题的研究,提出了LS+LAD的凸组合损失的高维稳健统计估计和多图模型联合估计的群桥方法,研究其高维统计性质,得到了凸组合形式下参数估计的具体显式表达和多图模型下参数估计的相合性及稀疏性两大理论.主要工作内容包括:第一章系统阐述了变量选择和图模型的研究背景与研究现状.第二章由高维稳健统计性质分析和高维罚稳健统计性质分析组成.先回顾了已有的几种损失函数参数估计的具体显式表达.最后重点针对LS+LAD的凸组合形式,得到了凸组合损失下高维稳健估计和高维罚稳健回归估计的显式表达,结果表明这种凸组合损失函数模型集成了LS和LAD损失的优点,同时消弱了它们的不足,具有优良的高维统计性质.第三章结合单一图模型和l1惩罚的多图模型,给出一种通过分层惩罚连接的单个图模型估计的Bridge惩罚多图模型.研究其高维统计性质,分析了估计参数的相合性和稀疏性.结果显示这种联合估计模型具有选择组间变量的同时对同组变量进行选择的优点.
其他文献
近年来,表面微织构作为一种可以显著改善表面摩擦学性能的方法得到了国内外学者的广泛关注,成为当前摩擦学领域研究的热点方向之一。为了最大程度改善滑动轴承的摩擦性能,本文采用理论计算、仿真模拟及实验测试的方法,研究微织构密度、尺寸、形状、深度及排列方式等参数对滑动轴承的油膜承载性能、油膜压力分布情况、轴承磨损情况的影响规律。首先,基于Reynolds方程在流体动压润滑条件下建立微织构滑动轴承数学模型和微
随机稳定性是研究系统存在随机扰动时,系统稳定性的理论.因其方法上的可行性和工程上的合理性,自产生以来便受到了广泛的关注.目前,随机稳定性仍是专家学者们研究的热点问题.众所
随机时滞系统(Stochastic time-delay systems)是现实中广泛存在的一类系统,用来表征随机干扰下的时滞系统.在实际的工程中,由于各种各样的随机因素以及系统本身的结构特征的影
同余关系在半环代数理论的研究中扮演重要角色.本文主要探讨了几类半环上与格林关系相关的开同余.主要结果如下:1.研究了加法半群为半格的半环(简称为ai-半环)上由格林L,R关系
目前对生化系统的优化已成为新兴代谢工程领域中一个重要的组成部分。为了获得生化系统的重要信息,人们需要优化生化系统,从而降低原材料消耗,提高产量,以促进生物产业发展。针对
市场监管是政府的重要职能之一,公正健全的市场监管体制对培育良好的市场秩序和维护公共安全有着极其重要的作用。改革市场监管体制,实行统一的市场监管,是建立统一开放竞争有序的现代市场体制的关键环节。随着我国经济社会的不断发展,社会各方对市场监管工作的要求不断提升,原有的市场监管体制与经济社会的发展越来越不适应。在这种背景下,我国于2013年年底开始着手对我国的市场监管体制实施改革,目的就是整合基层市场监
本试验采用单因素试验设计探讨了反应时间、反应溶液pH值、壳聚糖-膨润土比例(糖-土比例,W/W)和反应温度对膨润土-壳聚糖复合物(Bt-CTS复合物)制备效果的影响,通过正交试验设
1,3-丙二醇是一种重要的化工原料,可以用来合成许多具有优良特性的聚合物,所以如何提高其产量成为许多学者关注的问题。代谢工程法是提高1,3-丙二醇产量的一个重要方法,而了解细
气固两相流研究涉及广泛的工业生产过程,通过对其关键参数进行在线测量,进而实现对过程的优化控制,对于提高生产效率,降低能耗、节约能源具有十分重要的意义。由于气固两相流的测
切换系统是一类重要的混杂系统,在实际的工程应用中具有重要的意义,通常,它是由一系列子系统以及与之相应的切换规则构成,通过切换规则的作用,每个子系统均可以成为是一个独立的系