论文部分内容阅读
在医学,生物学等领域,对某给定事件发生的时间进行估计和预测的问题很多.从这些实际问题的数据资料来看,大部分数据集有一个共同的特征,即观测结果是删失的.当我们仅知个体在一个确定的时间段内存活过时,称此类数据为删失数据.当仅知个体在给定的时间仍然存活时,称之为右删失.当仅知个体在研究开始之前,已经经历了我们所感兴趣的事件时,称之为左删失.本文研究基于有偏抽样设计所得右删失数据下,比例风险模型中带有约束的回归参数的估计问题.有偏抽样设计作为一种既能节约成本又能提高效率的抽样方法被广泛应用于大型队列研究中,本文采用的有偏抽样设计有三种,即病例队列设计,广义的病例队列设计,基于因变量的抽样设计.此外,建模时,将参数的先验信息考虑在内,可以进一步提高研究的效率. 为了调节有偏的抽样机制,我们采用逆概率加权的方法提出一个新的估计函数,并基于该估计函数构建一个Working似然函数,进而提出本文所研究的凸优化问题.为了得到带有凸性约束估计量的相合性和渐近正态性,我们运用凸优化理论中的Karush-Kuhn-Tucker方法.为了给出带有箱形约束估计量的一个显示解,我们运用指数函数和负的对数函数的凸性,构造出Working似然函数的一个替代函数,该替代函数参数可分离,即其Hessian矩阵是对角型的,因此,最大化带有箱形约束的替代函数的问题等价于分别最大化一些带有区间约束的一维凹函数问题,进而可以通过中位数函数给出估计量的一个显式解. 模拟研究表明有偏抽样设计较简单随机抽样设计所得估计量更有效.同时表明所提的修正的极小极大算法较基于Working似然函数的Newton-Raphson算法和基于替代函数的原始的极小极大算法所得估计量更有效.在实际应用中,我们提醒用户在使用本文所提出的方法时,需要小心选择参数的约束,并提供了一个用示例图形来检查约束是否合理的方法.最后,基于有偏抽样设计,我们将提出的方法运用于Wilms瘤研究中,所得结果进一步表明研究人员在建模过程中不能忽略参数的约束,否则会导致错误的统计推断和低估研究的效率.