论文部分内容阅读
目的: 探讨有序分类纵向数据样本量的估计,并采用SAS编制Monte Carlo模拟宏程序对估计公式进行效能评估。 方法: 基于有序分类样本量的估计公式,结合纵向数据的特性,考虑条件相关系数ρ重复测量次数n,通过引入校正系数构建有序分类纵向数据样本量的估计公式。针对3个有序分类等级,2次重复资料的概率分布构造了模拟抽样的方法;然后构建多水平累积概率模型分析有序分类纵向数据。利用Monte Carlo模拟估计实际效能,并将有序分类纵向数据样本量公式计算的效能与Monte Car能进行比较,考核有序分类纵向数据样lo模拟估计的效能和多分类横断面数据样本量公式计算的效本量公式估计结果的有效性和可靠性。所有过程的实现均采用SAS宏完成。 结果: (1)构建得到有序分类纵向数据样本量计算公式:此处公式省略 (2)利用SAS编程,可以完成样本量估计、资料分析、Monte Carlo抽样的整个过程。 (3)有序分类纵向数据样本量公式估计的结果随着相关系数的增大而增大;随着重复次数的增多而减小,当重复次数大于5次,所需的样本量趋于稳定;样本率分布越不均衡,所需样本量越大;在组间效应差异一定的情况下,纵向设计可以显著地减少研究所需的样本量。 (4)有序分类纵向数据样本量公式估计的结果能很好的保证实际Power达到预设水准,相比横断面数据样本量估计公式可以较大程度上节约样本量。但是有序分类纵向数据样本量估计公式仍然存在样本量过分估计的问题。随着样本量的增大,有序分类纵向数据样本量公式估计的结果越好。 结论: 有序分类纵向数据样本量公式的估计虽然偏保守,但可以保证实际效能达到预设水平,并且相比横断面数据的公式能较大的节约样本。利用SAS编程,可以完成样本量估计、资料分析、Monte Carlo抽样的整个过程。因此,有序分类纵向数据样本量估计的公式是一种方便易用、且较可靠的样本量估算方法。