论文部分内容阅读
在现实生活中,一种事物的产生是与很多因素有关的。在讨论因素之间的关联性时,若我们只是采用两组相互独立的、服从二项分布的数据来进行试验,则在试验过程中所取的样本数将会很大,这就增加了计算的难度,造成了资源的浪费。所以为了更有效的研究因素间的关联性和消除混杂现象中讨厌参数的影响,我们采用2×2配对试验设计。在一般的2×2列联表的配对试验设计中,抽样的总数是固定不变的。当对2×2列联表中相对差进行极大似然估计,会出现相对差的分母为零的情况,从而使得相对差的估计出现无限大的偏差和没有有限方差。
本文就是为了避免出现上面这种情况,我们在抽样的过程中采用逆抽样的方法对相对差进行极大似然估计。即对相对差估计中分母可能为零的列联表的格子采用逆抽样。实际中已经有人采用过逆抽样的方法来进行相对差的极大似然估计,但在研究过程中他们所采用的统计量是一般的Wald统计量、对数Wald统计量和IFiller定理等方法来进行相对差的极大似然估计和置信区间的求解。并且在求解过程中采用delta的方法来获得感兴趣参数的一致最小方差无偏估计。
本文中在统计量方面我们采用了Score统计量和似然比统计量。且采用Fisher-score的方法来求解感兴趣参数的方差。构造统计量之后,我们求解各统计量犯第一类错误的概率和功效的大小;同时也求解了各统计量条件下相对差的置信区间平均长度以及覆盖概率大小的比较来得到统计量的优劣和各因素间的关联性。通过蒙特卡洛模拟我们得到如下结论:
1.处理小样本数据时,我们所建立的四个统计量中,Score统计量的性质是最优良的。因为利用Score统计量能保证第一类错误的概率小的条件下,使功效也能达到最小。并且,Score统计量条件下的覆盖概率也在给定的置信水平上下波动,且所得到的平均长度也小。
2.Wald统计量和Wald-Score统计量比Score统计量稍差一点,但处理大样本数据时,Wald统计量和Wald-Score统计量的处理效果更好;
3.在所有的四个统计量中,似然统计量的性质最差,因为同等条件下它犯第一类错误的概率比其他统计量要大。