论文部分内容阅读
正态随机效应Meta回归模型的作用在于探讨一些影响合并效应的病例特征,目的是为了找出各个研究间存在的异质性。但是在不对称的数据建模上,可能会违反正态性的假设,还可能会导致出现假阳性的结果,不能充分解释所有的异质性。正是因为它的局限性,相关学者提出了偏正态随机效应Meta回归模型。它的显著特点是将偏倚引入模型,随机效应项服从偏正态分布。偏正态随机效应的Meta回归可以剔除总体效应中由偏倚造成的异质性,达到使总体效应值更加接近真实情况的目的[2]。这就是偏正态分布随机效应Meta回归的优势所在。关于偏正态Meta回归的参数估计,相关学者提出了采用加权OLS的估计方法,但是该估计方法过于简单,没有利用更多的分布信息,而且通常在处理偏态分布的参数估计中,一般采用的都是极大似然估计法。因此,针对偏正态Meta回归模型,本文提出了采用EM迭代算法来进行极大似然估计,这在不对称的数据建模上显示出了巨大的灵活性。另外,我们知道在高斯分布的假设下,极大似然估计与最小二乘估计是等价的,但是在这里我们想要关注的是在偏正态分布的假设下,哪种估计方法更优。因此针对偏正态Meta回归模型,本文最终通过实验来验证极大似然估计与加权OLS估计的优劣。
关于本文研究的实施过程,主要分为两部分。一部分是模型的建立与参数估计。包括偏正态Meta回归模型的推导,EM算法的极大似然估计,加权OLS参数估计与正态Meta回归的极大似然估计。重点在于偏正态Meta回归的极大似然估计的推导与EM迭代算法的实施。另一部分是实验。包括模拟实验与实证研究,主要是用EM迭代算法求解极大似然估计值,并且根据AIC、BIC准则与加权OLS的参数估计作对比。模拟实验主要从三个方面来设计,包括EM算法下对数似然函数收敛性的检验,不同样本量下极大似然估计的误差表现(在此采用的是100次实验的平均相对误差作为估计精度的标准),极大似然估计与加权OLS估计的比较。通过模拟实验可知,针对偏正态Meta回归模型,EM算法下对数似然函数是逐渐增加并且收敛的,且随着样本量的增加,参数估计的误差在逐渐减小并且最终趋于稳定。由AIC、BIC准则可知,极大似然估计要优于加权OLS估计,估计精度更高。实证研究是基于卡介苗临床实验数据进行的,结果验证了对数似然函数的收敛性,同时也验证了极大似然估计比加权OLS的估计精度高。实证研究的结果与模拟实验结果是一致的。
本文的创新性成果在于对偏正态Meta回归模型进行了极大似然估计的理论推导,然后采用EM迭代算法求解出极大似然参数估计值,解决了对数似然函数没有显式解析解的问题。还通过AIC、BIC准则验证了偏正态Meta回归模型要优于正态Meta回归模型,同时还比较了Meta回归在偏正态分布的假设下,极大似然估计方法要优于加权OLS估计方法。
关于本文研究的实施过程,主要分为两部分。一部分是模型的建立与参数估计。包括偏正态Meta回归模型的推导,EM算法的极大似然估计,加权OLS参数估计与正态Meta回归的极大似然估计。重点在于偏正态Meta回归的极大似然估计的推导与EM迭代算法的实施。另一部分是实验。包括模拟实验与实证研究,主要是用EM迭代算法求解极大似然估计值,并且根据AIC、BIC准则与加权OLS的参数估计作对比。模拟实验主要从三个方面来设计,包括EM算法下对数似然函数收敛性的检验,不同样本量下极大似然估计的误差表现(在此采用的是100次实验的平均相对误差作为估计精度的标准),极大似然估计与加权OLS估计的比较。通过模拟实验可知,针对偏正态Meta回归模型,EM算法下对数似然函数是逐渐增加并且收敛的,且随着样本量的增加,参数估计的误差在逐渐减小并且最终趋于稳定。由AIC、BIC准则可知,极大似然估计要优于加权OLS估计,估计精度更高。实证研究是基于卡介苗临床实验数据进行的,结果验证了对数似然函数的收敛性,同时也验证了极大似然估计比加权OLS的估计精度高。实证研究的结果与模拟实验结果是一致的。
本文的创新性成果在于对偏正态Meta回归模型进行了极大似然估计的理论推导,然后采用EM迭代算法求解出极大似然参数估计值,解决了对数似然函数没有显式解析解的问题。还通过AIC、BIC准则验证了偏正态Meta回归模型要优于正态Meta回归模型,同时还比较了Meta回归在偏正态分布的假设下,极大似然估计方法要优于加权OLS估计方法。