论文部分内容阅读
在生物医学、生存分析的研究中,主要感兴趣的变量是兴趣事件发生的时间,而在实际研究中,它往往受诸多因素的影响,比如感兴趣事件是生物个体的存活时间,存活时间就受到很多诸如环境,性别,种族,年龄等因素的影响。研究这些协变量如果影响感兴趣事件变量是主要研究任务,从回归模型角度给出了量化的影响因素分析,进而找到重要的影响因素,据此可以进一步给出对感兴趣事件更佳的研究方案和思路。然而,在具体的研究中,有许多协变量是不能直接观测,需要通过一些潜变量模型描述刻画,因此关于潜变量模型的研究是当前生存分析研究的主要课题之一。本文首先简单介绍了生存分析中潜变量模型的发展、研究现状,常见删失数据类型、基本参数分布模型,经典生存分析风险回归模型以及截断删失数据似然函数的构造。其次,主要讨论了两类生存分析模型,一类不含潜变量的参数模型,一类含有潜变量的半参数回归模型,具体分为以下四个部分:第一部分,在左截断右删失数据类型下,当时间变量T服从广义指数分布时,关于尺度参数是否受协变量影响建立了两种模型,并且用极大似然估计方法估计出了模型参数,运用Newton-Raphson迭代算法求解方程,计算出模型参数的估计值。把未考虑尺度参数回归的模型运用变压器寿命数据集,得到不考虑外在影响因素时的生存函数和风险函数;把尺度参数回归模型运用到Channing house数据集中,得到性别影响的生存函数和风险函数。第二部分,在区间删失数据下,基于贝叶斯参数估计方法提出了广义指数分布下的加速失效回归模型,得到模型参数的似然函数与后验似然函数,利用Metropolis-Hastings算法得到参数的后验样本,并把后验样本的均值作为参数的贝叶斯估计值,使用R软件进行随机模拟。并运用该模型到Hemophilia分组数据中,分析不同实验组对生存函数的影响。第三部分,在区间I型删失数据下,结合因子分析模型,建立了含潜变量的加性风险联合回归模型。首先通过确定性因子分析(CFA)模型描述潜变量因子,根据潜变量和观测变量建立加性风险模型。之后,结合EM算法和Borrow-Strength估计方法推广了Pan等人(2015)年提出的hybrid估计过程获得估计方程,求解方程可得联合模型的回归参数,并在一些正则性假设条件下,证明了联合模型估计量的相合性,和渐近正态性。使用R软件随机模拟,在不同样本和不同基准风险函数下验证联合模型参数估计的有效性。第四部分,在区间I型删失数据下,建立了含潜变量的联合Cox比例风险回归模型。以第三部分潜变量因子估计为基础,给出区间I型删失数据下模型的近似偏似然函数,求偏导获得得分方程。潜变量因子是通过潜变量模型估计得到,在使用过程会导致估计方程存在偏差,因此需要纠正偏差,获得无偏估计方程,通过泰勒展开的方法给出估计量的渐近方差。在不同样本和不同基准风险函数下,使用R软件随机模拟,验证提出联合模型的有效性。