固定维和高维下的约束惩罚LAD估计

来源 :重庆大学 | 被引量 : 0次 | 上传用户:worbestczhy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,许多文献已经证明在多个应用领域下,先验和结构信息可以表示为回归系数上的约束,进而可以有效提高相关估计方法方法精度。为了将这些工作拓展到LAD估计的框架下,我们提出了带有线性约束L1惩罚的LAD估计,即pc-LAD估计,并且证明了pc-LAD估计可以有效地解决传统c-lasso(约束lasso)方法所能解决的统计问题。但不同于现有的c-lasso估计,pc-LAD估计在响应变量的观测数据具有厚尾的分布特征或存在异常值时,依旧表现良好。在理论上,我们证明了当预测变量个数p小于样本容量n,即当p是固定维时,pc-LAD估计具有一个有调整项的渐近方差的Oracle性质。而当p可以远大于n,即p是高维时,我们提出pc-LAD估计量的偏差上界比LAD-lasso系数估计Oracle上界(?)要小,其中k是真实显著性系数的数目。值得注意的是,这个结果在非常广泛的误差分布下都能成立,这些误差分布甚至可以包括柯西分布。在算法上,由于LAD损失函数和L1惩罚项的非光滑性,导致线性规划、解路径算法和贪婪坐标下降等传统算法无法应用与pc-LAD估计的求解中。为了更好的解决相关计算问题,我们不仅提出一个能解决该估计量在固定维下的线性规划算法,还提出了一个能解决该估计量在超高维度下的ADMM(alternating direction method of multipliers)算法。最后,我们进行了相关的模拟实验,分别包括和为零的约束、非负约束和复杂约束。实验结果表明,在添加了相应的约束以后,得到的估计精度相对于LAD-lasso和c-lasso都有了显著的提升。同样我们还采用了全球变暖、脑肿瘤和股指等真实数据对pc-LAD估计进行了验证,其结果都证实了我们提出的估计在c-lasso不可靠时,依旧能取得很好的效果。
其他文献
溃疡性结肠炎(ulcerative colitis,UC)是一种常见的消化系统疾病,其病情反复,病期较长,而临床上使用的治疗药物价格高昂、副作用多,具有较大的局限性。肠道菌群与其代谢物、宿主三者之间相互作用,对于维持肠道健康十分关键。近年来,色氨酸代谢通路在肠道稳态研究中得到了越来越多的关注。乳酸杆菌类在肠道色氨酸代谢通路中发挥着重要作用,此类菌群降解色氨酸后,可产生多种色氨酸代谢物,其中的吲哚衍
学位
原发性肝细胞癌(Hepatocellular carcinoma,HCC)作为肝癌首要的组织学类型,是一种诱因多、发病率和致死率均高的恶性肿瘤。传统的放化疗手段和肝移植手术常常难以根除HCC,治疗后容易复发和转移。因此,探索HCC更好的预防和治疗策略仍是临床上亟待解决的巨大难题。肝癌干细胞(Liver cancer stem cells,LCSCs)是肝癌中具备自我更新及分化潜力的肿瘤细胞亚群,对
学位
bHLH(basic Helix-Loop-Helix)转录因子在植物生长发育、抗逆性、光信号转导和激素合成等方面发挥重要调节作用。植物转录因子PREs属于非典型性bHLH亚家族成员,主要参与拟南芥和水稻等模式植物的油菜素类固醇信号转导、细胞伸长、光信号转导等途径的调节。然而在番茄中关于PREs转录因子的功能报道相对较少。因此,解析番茄PREs家族成员的功能显得尤为必要。本研究从番茄SGN数据库中
学位
膜电极组件(MEAs)作为质子交换膜燃料电池(PEMFCs)的核心部件,直接影响电池的成本、性能和使用寿命。现有的膜电极在涂覆工艺和Pt-Nafion离聚物界面结构方面仍然存在问题,主要表现在:(1)Nafion膜与水、小分子醇等溶剂接触时极易溶胀变形,致使目前主流的CCM制备技术不得不先将催化剂浆料涂覆在聚四氟乙烯等惰性基材上,然后再将催化层热压转印到Nafion膜上,这是当前CCM技术批量化制
学位
昆虫是地球上最早具备飞行能力的动物,这使其在寻找配偶、寻觅食物、躲避敌害和扩大分布等多个方面具有极强的竞争能力,也因此成为了地球上最繁荣兴旺的动物类群。约5000年前,家蚕(Bombyx mori)由野桑蚕(B.mandarina)驯化而来,长期的驯化和人工饲养使其丧失了飞行能力。生活于野外的野桑蚕,在寻找配偶和产卵地、躲避天敌等方面仍高度依赖于飞行能力。翅膀作为昆虫产生飞行行为的重要器官,其形态
学位
家蚕(Bombyx mori)是由野桑蚕(Bombyx mandarina)长期驯化而来的,与野桑蚕相比,其在生长发育、生活习性、体色形态及繁殖产卵等方面产生了很大的变化,尤其是在生活习性方面,家蚕爬行能力下降,耐拥挤,可以批量饲养。这种在驯化过程中行为发生变化的现象在其它昆虫中同样存在,有研究表明是受到了大脑神经肽及其受体的调节,并且在果蝇等昆虫的神经肽及其受体通路中鉴定出了可以调节行为的mic
学位
被子植物花器官的生长发育是一个极其复杂的过程,被多个内部遗传因子及外部环境信号所调控。MADS-box转录因子作为植物中较大的转录因子家族之一,对被子植物各个器官的生长发育至关重要,尤其是花器官的发育。本研究以番茄为实验材料,采用生物信息学、组织细胞学、酵母双杂交、RNA-seq等策略,对MADS-box转录因子SlMADS48在番茄中的生物学功能进行探索。此外,我们初步阐明了SlMADS48基因
学位
学习硬间隔支持向量机,一般采用著名的SMO迭代算法。论文研究发现:支持向量机是由支持向量所决定的,同时支持向量机的分离超平面与在支持向量上采用最小二乘法拟合出的分离超平面是相同的。因此本文的主要创新点是把支持向量机的训练转化为最小二乘法的迭代求解。本文所提算法的关键是要获取样本训练集的支持向量,但是获取训练集的真正支持向量是比较困难的。在论文提出的算法中每次迭代会先寻找嫌疑的支持向量。考虑到支持向
学位
番茄是全球范围内大面积栽培的重要经济作物,果实具有较高的营养价值。但病害导致的番茄腐烂变质是造成严重经济损失的主要原因。灰霉病作为一种危害极大的真菌病害,是番茄生产和采后的主要病害。因此,利用基因工程技术提高植株的抗病性具有重要的应用价值。当植物遭受到病原菌侵染时,会分泌多种病程相关蛋白(Pathogenesis-related proteins,PR蛋白)。病程相关蛋白NP24属于PR-5家族,
学位
在非寿险费率厘定中,车险是一个比较热门的研究方向,尤其是考虑相依风险的费率厘定模型,目的是研究保单中索赔次数和索赔额的相依关系,研究方法大多数是基于Copula回归模型,得到两者的联合模型以减少后续预测结果的偏差,这种做法被大多数学者证明具有现实意义。保险公司为了得到更精细的风险管理政策,和更精确的模型,不仅要考虑边际分布拟合的准确性,也要明确两者相依关系的结构,即影响相依关系的因素。本文利用Co
学位