论文部分内容阅读
属性数据分析是研究名义数据和有序数据的有效工具。在属性数据分析中,经常用对数线性模型来拟合列联表;可以用对数线性模型来分析列联表中变量之间的关联性,这是对数线性模型的一个突出的优点。φ-散度测度(φ-divergence measure)是Csiszár(1967)和Ali(1966)引进的一种刻画概率分布之间差异的度量。近年来,许多统计学家将φ-散度测度应用于各种不同的(回归)模型,其中就包含了多项抽样下的对数线性模型,定义和研究了最小φ-散度估计(MφE)及其性质。最小φ-散度估计是MLE推广,引进它的动力是与MLE相比它具有某种稳健性。可以预测,基于对数线性模型的重要性和φ-散度测度这种优良的性质,对这个方向的研究将会持续一段时间。正是因为这一点,我们将φ-散度测度应用于乘积多项抽样下的对数线性模型,工作可以分成三个主要部分。首先,在乘积多项抽样的对数线性模型下,我们定义了最小φ-散度估计,研究了这个估计的性质和基于这个估计的一些检验问题,其中就包含拟合优度检验、嵌套(nested)假设检验和局部对立假设检验。在一定的条件下,得到了最小φ-散度估计的渐近展开和渐近正态性;用这个估计和φ-散度测度来构造统计量,用它们做拟合优度检验、嵌套假设检验和局部对立假设检验,在各自的原假设下,这些统计量有渐近的(非中心)χ~2分布。另外,还得到了拟合优度检验的功效函数的渐近逼近。其次,在乘积多项抽样的约束对数线性模型下,我们定义了约束最小φ-散度估计(RMφDE),研究了这个估计的性质和基于这个估计的拟合优度检验和模型诊断问题。在一定的条件下,得到了约束最小φ-散度估计的渐近展开和渐近正态性;用这个估计和φ-散度测度来构造统计量做拟合优度检验,以检验数据是否来自一个乘积多项抽样下的约束对数线性模型,得到了拟合优度检验的功效函数的渐近逼近;考虑了局部对立假设检验问题,得到了在局部对立假设下,检验统计量有渐近非中心χ~2分布;另外,还利用约束最小φ-散度估计做了模型诊断研究。最后,我们用φ-散度测度和最小φ-散度估计构造统计量对对数线性模型的非可加性检验和模型选择问题进行研究。考虑到用对数线性模型对实际数据进行建模可能不充分,我们构造了三类统计量对乘积多项抽样下对数线性模型的非可加性(nonaddivity)进行检验,这三类统计量都有渐近的χ~2分布;利用φ-散度测度和最小φ-散度估计构造了一个对数线性模型的模型选择准则,证明了这个模型选择准则是强相合的,还得到了这个模型选择准则的错判概率有指数型上界。