贝叶斯框架下一类稀疏Logistic回归模型的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:AsiaIT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、云计算等现代科学技术的发展,海量高维数据逐渐渗透到社会生活的各个方面。高维数据特征维度很大,甚至远大于观测样本数,这给数据的存储、建模和计算带来很大的困难。然而这种数据往往包含大量的冗余信息,在具体问题进行建模分析时,真正涉及到的特征维度通常远低于观测数据维度。稀疏学习就是从高维复杂数据信息中筛选出我们需要的特征,达到压缩信息的目的。常见的稀疏学习可以从正则化稀疏模型以及贝叶斯角度下的稀疏学习方法等方面入手,而上述两种方法之间可以相互转化。基于贝叶斯理论框架,对线性模型稀疏学习问题的研究已经具备了较为完善的理论和体系,但线性模型存在一定的局限性,对很多问题并不适用。因而我们考虑在广义线性模型下的稀疏贝叶斯学习问题,从应用较为广泛的Logistic回归出发,在贝叶斯框架下研究稀疏模型的相关性质。本文取系数先验为尖峰厚尾分布――广义双Pareto分布,保证能够明显区分零附近的系数和非零系数,从而达到稀疏学习的目的。本文从理论上证明了这种先验分布定义方式具有良好的性质。首先,我们揭示了本文模型下待估系数最大后验估计与正则化过程的联系,同时推导了在给定先验下最大后验估计的Oracle性质:稀疏性和渐近正态性。其次,本文从贝叶斯角度出发,研究了在广义双Pareto收缩先验下Logistic回归系数后验分布的性质,证明得到,在7)2范数意义下,系数的后验估计渐近集中于真实稀疏向量。最后,本文利用EM算法和Gibbs采样算法分别来求解最大后验估计和后验均值估计,并利用数值模拟验证本文方法的有效性。
其他文献
随着我国人口老龄化形势的不断加剧,老人的高龄化以及失能率的不断上升为居家养老服务体系的发展带来了前所未有的机遇与挑战,如何为居家养老的失能老人提供健康合理的照护服务已成为亟待关注和解决的问题。经文献研究和实地调研发现我国的居家养老服务模式尚不完善,社区及机构养老护理人员、设备资源紧张,未受过专业护理培训的家属,不得不承担起照护居家失能老人的任务,特别是失能老人需求率高、自理程度低、护理难度大的洗浴
学位
随着科技的发展,多媒体数据在生活中占据了越来越重要的地位。光场是一种特殊的图像,相比传统二维图像,它含有更丰富的信息与更加广泛的应用。由于硬件设备的高灵敏度,在捕获光场的过程中,往往会因为环境导致获取到的数据损坏,影响后续技术的发展。由于设备限制,光场含有较低的空间分辨率与角分辨率,使得复原更加困难。因此,如何在现有条件下,从损坏的数据复原出高质量的光场,成为一个重要的研究问题。在获取光场的过程中
学位
现场可编程门阵列逻辑(Field Programable Gate Array,FPGA)是作为专用集成电路(Application Specific Integrated Circuit,ASIC)领域中的一种半定制电路而出现的,在传统可编程器件的基础上进行了改进,解决了定制电路存在的不足以及门电路数量有限的缺点。因其灵活性、并行性、集成性等特点被广泛应用于通信、图像处理、数据中心等领域,但同时
学位
招生过程对于任何高校而言都是内部运营和整体管理中非常重要的一环。能否顺利完成招生任务,获得更优质的生源,这会直接决定一所高校的声誉,以及高校的人才培养成果。新的社会情势和技术发展背景下,使得高校在传统的招生模式下在不断寻求创新。尤其是新冠疫情的到来,不仅给很多行业和领域带来了冲击和挑战,这也不断催生出了各个行业和相关领域在经营与运作模式上的变革,线上招生就是一个很好的典范。这种方式很大程度顺应了时
学位
屎肠球菌(Enterococcus faecium)是哺乳动物胃肠道中常见的共生菌。但是由于抗生素的滥用,耐药性屎肠球菌已经逐步进化成为全球范围内的重要病原菌。杆菌肽是一种由地衣芽孢杆菌(Bacillus licheniformis)和枯草芽孢杆菌(Bacillus subtilis)非核糖体合成酶合成的多肽类广谱抗生素,在我国的畜牧养殖行业中作为促生长剂和预防用药被广泛应用,起到促进动物生长和抑
学位
现代社会,随着人类各种社会活动增加,公共环境中各种突发人群异常事件比如踩踏、斗殴、恐怖袭击等时有发生。2021年4月30日凌晨以色列发生的严重踩踏事故,再一次敲响了对人群进行有效监管的警钟,同时也表明传统的人力监管无法有效应对日益庞大和密集的人群。因此迫切需要快速、准确的人群异常检测算法提高安全防范和预警能力。近年来,随着深度学习技术的快速发展,已经在诸如图像分割、目标检测等很多计算机视觉任务中取
学位
杨梅(Myrica rubra Sieb.et Zucc)是我国南方特色水果,杨梅汁颜色鲜艳、酸甜适口、风味诱人,深受消费者的喜爱,是目前杨梅深加工的最主要产品。花色苷是杨梅汁的呈色物质,贡献了鲜艳的红色,但是花色苷稳定性不佳,容易受加工条件的影响发生降解,导致杨梅汁颜色的劣变。甜菜红素是结构不同于花色苷的另一种天然色素,在红心火龙果中的含量较高,其颜色鲜艳稳定,具有在食品着色领域应用的价值。因此
学位
计算机试验指借助计算机模型如数学统计模型、计算机代码等来模拟真实物理、化学过程的仿真试验。当传统的实体试验难以实施或者费时、费力、费钱时,使用计算机试验来代替传统的实体试验已经成为一种重要的研究手段。随着计算机科学的发展,计算机仿真试验变得越来越复杂。许多计算机仿真过程涉及多个嵌套的计算机模型,即内层计算机模型的输出是外层计算机模型的输入。本文聚焦由两个计算机模型嵌套而成的仿真模型,主要研究嵌套计
学位
枸杞鲜果营养成分丰富,深受消费者的青睐,但其肉质极软、极易腐烂变质。本文创新性地将枸杞鲜果(Lycium barbarum L.cv.Ningqi No.10)置于不同CO2浓度(0、5%、10%、15%)中,于0℃贮藏28天。贮藏期间定期监测枸杞鲜果的表观品质和微观结构,采用靶向代谢组学分析枸杞鲜果果实体内糖类、有机酸类、酚类化合物含量,利用空间代谢组学分析差异代谢物的空间分布和相对丰度,并对其
学位
淀粉是碳水化合物主食的重要成分及供能物质。然而,现代谷物粮食过度加工,导致“米面过精、消化过快”,长期食用人群易产生高血糖、肥胖等亚健康问题。抗消化淀粉(Resistant starch,RS)在抑制人体血糖升高、促进肠道蠕动与菌群益生等方面优势显著。其中,淀粉糊化回生后制备的RS3是一种通过分子链间氢键、范德华力诱导重结晶的功能淀粉,加工后常存在重排晶区杂乱、结构调控性差、产品口感差等问题。调控
学位