偏正态分布Meta回归的极大似然推断

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:sxq5588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正态随机效应Meta回归模型的作用在于探讨一些影响合并效应的病例特征,目的是为了找出各个研究间存在的异质性。但是在不对称的数据建模上,可能会违反正态性的假设,还可能会导致出现假阳性的结果,不能充分解释所有的异质性。正是因为它的局限性,相关学者提出了偏正态随机效应Meta回归模型。它的显著特点是将偏倚引入模型,随机效应项服从偏正态分布。偏正态随机效应的Meta回归可以剔除总体效应中由偏倚造成的异质性,达到使总体效应值更加接近真实情况的目的[2]。这就是偏正态分布随机效应Meta回归的优势所在。关于偏正态Meta回归的参数估计,相关学者提出了采用加权OLS的估计方法,但是该估计方法过于简单,没有利用更多的分布信息,而且通常在处理偏态分布的参数估计中,一般采用的都是极大似然估计法。因此,针对偏正态Meta回归模型,本文提出了采用EM迭代算法来进行极大似然估计,这在不对称的数据建模上显示出了巨大的灵活性。另外,我们知道在高斯分布的假设下,极大似然估计与最小二乘估计是等价的,但是在这里我们想要关注的是在偏正态分布的假设下,哪种估计方法更优。因此针对偏正态Meta回归模型,本文最终通过实验来验证极大似然估计与加权OLS估计的优劣。
  关于本文研究的实施过程,主要分为两部分。一部分是模型的建立与参数估计。包括偏正态Meta回归模型的推导,EM算法的极大似然估计,加权OLS参数估计与正态Meta回归的极大似然估计。重点在于偏正态Meta回归的极大似然估计的推导与EM迭代算法的实施。另一部分是实验。包括模拟实验与实证研究,主要是用EM迭代算法求解极大似然估计值,并且根据AIC、BIC准则与加权OLS的参数估计作对比。模拟实验主要从三个方面来设计,包括EM算法下对数似然函数收敛性的检验,不同样本量下极大似然估计的误差表现(在此采用的是100次实验的平均相对误差作为估计精度的标准),极大似然估计与加权OLS估计的比较。通过模拟实验可知,针对偏正态Meta回归模型,EM算法下对数似然函数是逐渐增加并且收敛的,且随着样本量的增加,参数估计的误差在逐渐减小并且最终趋于稳定。由AIC、BIC准则可知,极大似然估计要优于加权OLS估计,估计精度更高。实证研究是基于卡介苗临床实验数据进行的,结果验证了对数似然函数的收敛性,同时也验证了极大似然估计比加权OLS的估计精度高。实证研究的结果与模拟实验结果是一致的。
  本文的创新性成果在于对偏正态Meta回归模型进行了极大似然估计的理论推导,然后采用EM迭代算法求解出极大似然参数估计值,解决了对数似然函数没有显式解析解的问题。还通过AIC、BIC准则验证了偏正态Meta回归模型要优于正态Meta回归模型,同时还比较了Meta回归在偏正态分布的假设下,极大似然估计方法要优于加权OLS估计方法。
其他文献
在疾病筛查的研究中,分组检测(Group Testing)是一种常用方法,该方法通过集合多个样本合并检测进行个体性状分类,替代了单体检测来筛选患病个体,具有节约成本的优势.1943年Dorfman提出的分组检测方法被认为是该领域的开创性发展,自那开始,该方法得到越来越多统计学者的关注,目前已经应用至公共医疗卫生、生物、化学、药物筛选、基因选择等领域,为大规模人群疾病筛查节约了成本.我们讨论的分组检
学位
超高维数据普遍存在于生物信息、图像处理和经济问题中.在这类数据中,协变量的维度远大于样本量,并且随着样本量的增加而增加,然而起到作用的变量却是少数,呈现出稀疏的特点.在统计建模的过程中,如果选入了与响应无关的变量,一来会干扰对变量间关系的理解,二来今后需要对该变量进行持续观察而加大成本.需要从中筛选出重要的变量以降低协变量的维度.在超高维数据中,传统变量选择方法计算代价高、统计精度和算法稳定性都受
学位
本文主要利用经验似然方法分别研究了非线性回归模型和Probit回归模型误差方差的估计问题,并在一定的假设条件下,证明了该估计量的渐近正态性,得出该估计量的渐近方差比传统估计的渐近方差更小.通过数值模拟验证了本文的主要结论,同时比较本文提出的估计与传统估计的功效.本文的主要内容为:第一章是绪论,对非线性回归模型的研究概况,Probit回归模型的研究概况,经验似然方法的研究概况以及本文研究的内容和创新
在遗传学研究中,全基因组关联分析(GWAS)是研究复杂疾病与基因关系的一种常用分析方法,该方法通过研究目标基因与特定疾病之间的相关关系以此找出与疾病关联性较强的基因.自从2005年Klein等人通过基因关联分析成功找出影响黄斑变性的基因,已陆续帮助科学家筛选出与冠心病、肥胖、2型糖尿病、精神分裂症等复杂遗传疾病相关的基因点位.随着基因分型与测序技术快速发展,使得获取成千上万基因点位数据变为可能.这
学位
在大数据时代中,变点检测作为统计学中长期研究的课题之一,有着举足轻重的作用.本文研究模型中系数的变点,其中,该模型的误差是非对称的,模型中的解释变量的个数非常巨大,并且被解释变量存在滞后项的影响.针对这几种情况,本文在前人提出的线性期望分位数的基础上,进一步考虑加入被解释变量滞后项的线性期望分位数混合模型.基于此模型,通过期望分位数和adaptive LASSO估计方法导出对应的残差的CUSUM.
学位
学位
当前中国经济增长步入中高速阶段,能源供需矛盾突出,环境污染加剧,环境保护任务艰巨,深入研究环境规制对制造业绿色全要素生产率的影响对于解决这些问题具有一定价值和意义。因此,本文基于空间计量模型,系统分析环境规制对制造业绿色全要素生产率(Green Total Factor Productivity,GTFP)的影响及空间差异,为环境规制改革方向和环境规制最优组合提供借鉴,提高环境规制效率,推进制造业绿色全要素生产率的增长,实现制造业省域协同、持续、健康发展。本文在对国内外环
学位
经济增长和环境保护之间矛盾始终是中国政府密切关注的问题和焦点,而日益突显的生态退化和自然资源浪费等问题,已经逐渐成为中国经济飞速发展背后的重要环境隐忧,为尽快实现绿色经济和社会可持续发展,加速转型至低碳节能的发展模式,党的十九大报告明确提出“绿水青山就是金山银山”的环境治理目标。唯有进一步提高绿色科技水平,才能真正实现二者均衡协调发展。国务院总理李克强早在2015年便首次明确提出“中国制造2025
近年来,在经济全球化和区域经济一体化的推动下,国家间的合作日益加强,国际贸易中传统关税等带来的贸易壁垒逐渐减弱,非关税壁垒和隐形贸易壁垒等逐渐成为阻碍国家间贸易合作的主力。由于各国经济发展水平不同,在基础设施建设、电子商务环境、海关效率以及制度环境等方面的发展存在差距,这些隐性贸易壁垒带来了国家间贸易成本的增加。因此,提升贸易便利化水平,对于改善国家贸易合作环境,加强国际合作,缩小国家间发展差距,
巴基斯坦是中国在全球范围内唯一的全天候战略合作伙伴,“中巴经济走廊”更是“一带一路”的旗舰项目,而且在南亚地缘格局中,巴基斯坦也一直扮演着十分重要的战略角色。此种背景下,中巴经贸合作不仅仅是夯实中巴全天候战略合作伙伴关系的必要,也有利于巴基斯坦弥补自身国家发展、能力建设的短板,更对南亚地区的地缘格局维持总体平衡具有积极意义。随着中巴贸易的进一步发展,影响中巴贸易潜力实现的非效率因素也在发生变化,并
学位