论文部分内容阅读
列联表又称交互分类表,所谓交互分类,是指同时依据两个(或多个)变量的值,将所研究的个案分类。交互分类的目的是将两变量(或多变量)分组,然后比较各组的分布状况,以寻找变量间的关系,使用列联表的目的就在于研究各种分类变量之间的关系。仅有两个变量构成的列联表,称之为2×2列联表,而由多个变量构成的列联表称之为多维列联表。列联表作为定性数据的主要表现形式之一,被广泛地应用于经济应用、教育效果、生物科技、科技发展因素分析、临床医学、预防医学等领域的研究。列联表中有许多重要的指标,如交叉乘积比P11P22/P12P21,对角和P11+P22,基本格子的概率对其所在行和列的概率乘积的比值Pij/Pi+P+j,i,j=1,2等等。而列联表的另一重要指标:列比差P11/(P+1)-p12/p+2可运用于医学灵敏度的分析,及教学评测的度量等。查阅相关文献,发现列比差却鲜有人研究。因此本文对列联表的列比差指标用Bayes方法作了相关研究。因为列联表不同维数的研究方法和原理都是一样的,所以本文对最简单的列联表(即2×2列联表)进行研究,其研究方法和步骤可引申到多维复杂列联表的情况。 本文运用Baye基本方法和原理,在假定2×2列联表参数P=(P11,P12,P21)服从Dirichlet先验分布的条件下,推导出P=(P11,P12,P21)的后验分布也服从Dirichlet后验分布,据此进一步得到列联表列比差的分布函数。在此基础上建立列比差的Bayes置信区间,分别讨论了列比差的等尾置信区间和最短置信区间,并通过模拟方法对两种置信区间进行了优良性比较。此外,本文用另一种方法即:频率派的Score统计量推导出列比差的置信区间,并对频率派得出结果与Bayes派相比较。最后对列联表的列比差的置信区间进行了Bayes假设检验。模拟研究和数据分析结果表明本文所得结果是有效的,本文所做研究对医学、教育、经济等领域的定性分析有一定的理论和实际应用价值。 本文主要创新点在于:有关列联表的的论文虽然很多,但大多数文章是关于列联表应用的,而本文是从理论的角度用Bayes方法对列联表的列比差指标进行推导和分析,为列联表的列比差指标P11/(P+1)-P12/(P+2)提供理论支撑,为后续的列联表列比差的应用分析作了铺铺垫。