论文部分内容阅读
条件统计推断是统计推断的一个重要组成部分。在实际中,我们往往已经知道一些变量对响应变量是重要的。因此,我们关心的是在给定这些重要变量的情况下,其他协变量与响应变量是否独立,即条件独立性检验问题。另外,我们也关心给定某些重要变量情况下的变量筛选问题。最后,我们考虑条件生存函数的估计问题。文章的主要内容如下: (1)研究了条件独立性的假设检验问题。通过边际分布积分转换法,将条件分布转换为无条件矩的形式,并且基于两个无条件矩之间的Cramér-vonMises距离构造检验统计量。在一定的条件下,证明了该统计量在原假设下的渐近分布,在备择假设下的相合性,以及在n-1/2局部备择假设下的渐近分布。最后,提出bootstrap重抽样算法,来计算渐近分布的临界值。我们通过数值模拟研究了所提方法的有限样本表现。 (2)研究在给定某些重要变量的情形下,无模型假定的变量筛选问题。根据“条件距离相关性”(conditional distance correlation)的定义,提出了一个条件边际效用来刻画给定某些重要变量情形下,其他协变量对响应变量的贡献程度。在一定的条件下,证明了提出的筛选方法具有“确定筛选性质”(surescreening property)。我们通过数值模拟和实际例子研究了所提方法的有限样本表现。 (3)研究带删失数据的变系数单指标模型的变量筛选问题。通过给出删失变量生存函数的Kaplan-Meier估计,我们提出了简单的逆概率加权条件边际效用。类似于第二部分,将协变量对响应变量的贡献程度进行排序,选出重要变量。在一定的条件下,证明了所提出的方法具有“确定筛选性质”(surescreening property)和“秩相合性”(consistency in ranking)。我们通过数值模拟和实际例子研究了所提方法的有限样本表现。 (4)研究在给定协变量情形下,生存时间和删失时间不满足随机删失假定,删失指标随机缺失时,条件生存函数的估计问题,并给出了估计的渐近性质。我们用“连接函数”(copula function)来刻画生存时间和删失时间的相关关系,并通过补值方法处理缺失的删失指标。我们通过数值模拟研究了所提方法的有限样本表现。