基于混合分布回归模型的统计学习方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:liangfeng905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回归模型是任务学习中很重要的一种模型。传统的回归模型一般基于正态分布假设。然而,当数据中的噪声来源不是高斯分布时,正态分布的假设显然是不充分的,而且高斯分布对数据中的异常值也很敏感。基于混合模型的有限混合分布可以在一定程度上缓解由分布假设不正确引起的问题。例如混合高斯分布在回归、聚类、去噪和图像分割等模式识别领域有很多应用。T分布是一种重尾分布,因此可以降低异常值的影响从而得到鲁棒的模型。由于混合分布的这个特点,本文研究了基于混合分布的回归模型统计学习方法。本文主体工作包括:第一章主要叙述了混合分布及其国内外研究现状,非线性分类模型,非线性回归模型和处理多任务问题的多任务回归模型。以及混合分布应用于非线性回归模型的研究现状和存在的不足。最后介绍了基于多模态数据的阿尔兹海默症分类预测研究。第二章建立了基于核方法的非线性分类模型,结合混合高斯分布对噪声及异常值建模。针对阿尔兹海默症的70个样本数据具有多模态的特点,将其与核方法的思想结合。通过将各个模态的数据线性加权结合的方法得到含有多个模态信息的混合核。然后用基于混合高斯的稳健非线性分类模型对混合核进行处理。实验结果表明,模型不仅能够很好的处理多模态数据,而且对噪声具有很好的识别性,从而较大程度地提高分类效果。第三章研究非线性回归问题,我们提出了一个基于混合T分布的鲁棒非线性回归模型。该模型不仅可以降低噪声和异常值的干扰,而且可以快速地学习出模型的非线性结构。在模型建立过程中,通过对潜变量的引入使得模型具有一个层次结构,这样的好处是不仅可以简化推断过程,而且层次结构也可以方便我们分析原理,从而本质上理解混合T分布相比于混合高斯模型的优点。在参数估计阶段,我们建立了一个EM算法和拉格朗日乘子法相结合的优化算法迭代地求解参模型的惩罚似然函数。第四章将单任务回归模型使用任务学习推广到多任务领域。在多任务邻域,我们可以共同学习多个任务的参数,从而达到信息共享的效果。而通过在任务中增加惩罚的方法,可以使得模型性能得到一定程度的提升。模拟和实例数据中的结果都可以验证多任务模型的性能。综上所述,混合分布在实际应用中具有重要的意义。模拟和实例分析表明,基于混合分布的分类和回归模型对复杂噪声具有更稳定的效果。而将单任务模型推广到多任务模型可以有效利用相似任务之间的信息。
其他文献
通用航空产业是以通用航空飞行活动为核心,涵盖通用航空器的研发制造、市场运营、综合保障以及延伸服务等全产业链的战略性新兴产业体系。Z市大力发展通用航空产业,有利于强化Z市全国综合立体交通枢纽地位,加快国家中心城市建设;有利于促进产业转型升级,提升中原经济区的辐射带动能力。但与其他通用航空发展比较成熟的城市相比,Z市通用航空产业的发展才刚刚起步。在起步阶段,要想促进该产业均衡、快速、稳定的发展,仅凭市
黄山贡菊(Dendranthema Morifolium cv.Gongju)为中国特色花类中药植物,含有多种活性成分,具有延缓衰老,疏风降压,清热解毒,清肝明目等功效。本文以贡菊的抗氧化活性成分绿原酸
国际法中的跨界环境损害问题发展至今已有上百年历史,对于其中涉及的关键概念的界定、国家责任、预防原则和损害分配原则研究成果也趋于成熟。环境损害的赔偿问题于1978年正
随着中国城市化进程的快速发展,生活水平逐步提高,人们对于生活环境的要求越来越高,特别是空气的质量。伴随着工业及交通运输业的发展,越来越多的有害物质被排放到空气中,改变了空气的正常组成,使空气质量变坏。空气污染对人们的日常生活和健康产生了重大影响,因此,提出一个可精准监测周围空气质量的系统就具有重要的意义了。传统的环境监测方法为定点监测,这种方法实施起来较为简单,但是这种方法会因为采集区域的不均匀而
铁元素是生物进行多种代谢活动的重要辅助因子,真菌抵抗氧化胁迫以及提高自身的耐受性都需要铁代谢相关蛋白发挥重要作用。本研究通过同源克隆得到红根病菌铁代谢相关的三个
波浪破碎是常见的一种海浪现象,其对波浪成长、波浪与结构作用以及海水和大气水气交换都起到重要作用。考虑到实际海况中波浪的传播是多向的,特别是深水中,多向波浪破碎与传
在大动物中,大多数性状属于数量性状,而水牛的产奶性状更是一个复杂的数量性状。在以往研究中多数是针对一个靶基因进行调控,很难达到调控产奶量和奶品质的目的,且大多数研究
在全球能源短缺和环境污染严重的情况下,汽车行业的发展正面临着严峻挑战。节能、环保、安全已经成为汽车新兴的发展研究方向。而基于轮毂电机驱动的电动汽车以其独特的结构优势和性能特点,目前广泛应用于电动汽车动力性和稳定性两方面研究。本文选取四轮轮毂电机驱动电动汽车为研究对象,对车辆的横摆稳定性控制问题进行探讨,针对电机转矩输出不足的情况,采用电机、液压系统协调控制,充分考虑各种约束条件,根据下层执行器的响
大豆作为一种营养成分较为全面的食品原料,具有广阔的发展前景。7S大豆球蛋白作为大豆蛋白中的重要组分,其结构域的理化性质会作用于大豆蛋白的功能特性,进而影响大豆制品的
卵圆真绥螨是一种重要的捕食性螨,它可以捕食叶螨、粉虱、蓟马等多种害虫、害螨。本文以卵圆真绥螨为研究对象,研究花粉、蜂蜜、葡萄糖、榕管蓟马、椭圆嗜粉螨以及人工配方饲