偏正态数据下有限混合位置、均值回归模型的统计推断

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:wangchello
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物学、金融、医学等研究领域存在大量响应变量为非对称的情形,受到许多研究者的关注,统计学家对此引入了偏态分布,其增加额外的偏度参数表示非对称分布的方向和程度。为了克服回归模型中正态随机误差的不足,捕捉到更有效信息,本文假定随机误差服从偏正态分布。此外,经典的统计模型忽略了数据的异质性,可用有限混合回归(FMR)模型来分析来自异质总体的数据。因此,在分析具有异质性和非对称性数据时,偏正态有限混合模型比经典的正态混合模型等更为灵活。本文针对偏正态(SN)数据,提出有限混合位置回归(FMLR)模型、有限混合均值回归(FMMR)模型,对其进行参数估计、变量选择、Bayesian分析等的统计推断与算法研究。本文的研究内容主要分为以下三个部分:第一,基于两点步长梯度下降法研究了偏正态分布下位置、均值回归模型的参数估计。首先,使用Sahu提出的偏正态函数的随机表示和分层表示,减少了数值计算中的计算困难。其次,通过EM算法,结合梯度算法来估计未知参数。最后,完成Monte Carlo模拟对所提出的方法进行评价分析,通过一组糖尿病患者的BMI数据进行实例分析,说明该参数估计方法有效。第二,基于惩罚似然研究了偏正态分布下FMLR模型和FMMR模型的变量选择。首先,利用三种不同的惩罚函数SCAD、LASSO和Hard对原似然函数进行惩罚,选择适合的调谐参数,从众多协变量中选择对解释变量有显著影响的关键变量。其次,证明了变量选择的相合性和参数估计的Oracle性质。最后,通过Monte Carlo模拟该模型和方法是有效的,将所提方法用于一组葡萄酒实际数据中,进一步阐明方法的实际意义。第三,基于贝叶斯框架研究了偏正态分布下FMLR模型和FMMR模型的贝叶斯估计。首先,选取FMLR模型和FMMR模型未知参数的先验分布。其次,运用Gibbs抽样和Metroplis-Hastings算法的混合MCMC算法得到后验样本。最后,通过模拟说明该估计方法有用,将该方法用于一组全国AQI数据中,说明我们方法的实际效果。
其他文献
我国岩溶发育茂盛,众多房屋建筑以及基础设施包括市政道路、公路和铁路需在浅埋岩溶地下洞穴密布和发育的地区修建,而这些设施可能因为地下洞穴的影响发生地面变形、滑坡等灾害从而严重影响各类设施的安全与使用,所以在岩溶地方开展各类建设项目时,往往需要对有关场地进行稳定性评估。目前国内外的研究成果中,有关地下洞穴与岩土体稳定性关系的研究绝大部分专注于研究岩溶与地下洞穴的关系、地下洞穴本身的力学参数及其形成规律
学位
顶点覆盖约束下的平行机排序问题和拒绝费用受限的平行机排序问题都是著名的NP-难问题,假设P≠NP,那么这两个问题不存在多项式时间精确算法.在顶点覆盖约束下的平行机排序问题中,工件和图的顶点一一对应,工件的加工时间代表顶点的权重,图的边限制了工件之间的关系,目标是找到一部分工件使得这部分工件既是图中的一个顶点覆盖同时在机器上的最大完工时间达到最小.在拒绝费用受限的平行机排序问题中,每个工件都有一个加
学位
具有偏斜特征的异质数据广泛存在于生物医学、气候科学和经济金融等领域.经典的统计模型忽略了数据的异质性,不适用于分析来自异质总体的数据.有限混合回归(FMR)模型是处理这类数据的有效统计工具,它的软聚类机制同时实现了异质数据的聚类和建模,在回归和聚类分析等方面有着广泛的应用.传统统计推断方法的应用要求数据服从对称分布,然而现有的真实数据的分析结果表明,相比于对称分布,偏斜分布能捕捉到的信息更加准确和
学位
随着科学技术的高速发展,医学、金融、生物学等领域中产生了大量的类不平衡数据,如何从中提取出有效信息成为近年来的研究热点和难点。传统的分类算法旨在获得最大的分类精度,导致少数类样本常被误分为多数类,此时传统的分类算法不再适用于不平衡分类。针对这一问题,本文从数据层面和代价敏感层面展开不平衡数据的统计建模研究,主要成果如下:过采样作为处理不平衡数据分类的常见方法,通过合成少数类样本,以降低原始数据集不
学位
数字图像的获取、传输、保存的过程中由于外界的随机因素,不可避免地会受到种种干扰,这些干扰使得图像像素的灰度值改变,从而在图像中出现突兀像素点以及模糊现象,为了还原干净清晰的图像,从频率域和空间域上设计了许多针对含噪图像的降低噪声的技术,简称为图像降噪。纵观图像降噪的发展历程,从均值滤波到全变分模型以及卷积神经网络去噪技术,各种技术或多或少都带有平滑图像的思想,即将梯度过大的像素值分到周围像素点上,
学位
特征选择和消除方法目前广泛地被应用于生物医学领域的数据挖掘。然而,经典的特征选择方法通常侧重于平衡数据和数值型数据,所以这些方法在处理不平衡或混合类型数据时,可能会导致分类器的性能较差。此外,现有的研究甚少考虑数据集中同时包含不平衡和混合属性的情况。因此本文提出了一种新的特征选择方法,称为自适应损失向后特征消除(AL-BFE),以处理不平衡的混合型数据。主要工作与创新点包括以下几个方面:一、在AL
学位
组织是通过契约关系为纽带建立起来的特殊群体,而契约又有两种形式:经济契约和心理契约。长期以来,经济契约在组织绩效管理等问题上扮演着重要角色,然而心理契约作为另外一种重要的推动力量,也不应该被忽视。刚刚过去的2021年是中国共产党的百年华诞,全社会掀起了“四史”学习热潮,值此契机,该文结合工程管理学科建设需要,回顾工程管理的发展历史,发现改革开放前后国家工业化建设时期曾有这样一个令人惊异的“单位人”
学位
本文主要研究来源于几何学、可积系统和流体力学等领域的b族Novikov方程和Novikov方程组,包括研究peakon解,对称性和解析解等.主要内容如下:(1)研究b族Novikov方程和Novikov方程组的peakon解.分别给出b族Novikov方程和Novikov方程组的弱形式,通过弱形式计算获得b族Novikov方程的单peakon解、双peakon解以及Novikov方程组的peako
学位
保角变换作为求解数学物理方程定解问题的重要方法之一,在电磁学、流体力学、空气动力学等众多的物理学领域中有着重要的应用,由于其具有较高的实际应用价值受到了许多学者的关注与研究.在求解复杂的保角变换问题过程中,科研工作者们常采用数值计算法.在近年来的研究中提出了多种保角变换的数值计算方法.其中,基于模拟电荷法的数值保角变换法(Amano法)由于具有原理简单、精度高和科学的误差评价标准等优点,受到了学者
学位
图像风格迁移是一种借助计算机生成新图像的技术,尤其是在图像轮廓形状、颜色分布、线条特征等方面的生成。摄影图像风格迁移技术存在一个矛盾:即风格迁移技术既期望得到强烈的局部色彩效果,又期望图像结构内容不会发生几何变形。在卷积神经网络中,色彩信息和基本轮廓信息属于浅层具体特征。如何保留和利用浅层信息是摄影图像风格迁移的关键。本文以循环一致对抗网络为基础,针对摄影图像风格迁移方法展开研究,主要研究内容如下
学位