论文部分内容阅读
【摘要】 目的:以标准治疗为对照的非劣性/等效性检验中样本含量估计及软件实现。方法:采用PASS 11软件和相关计算公式,并通过实例分析计算两样本均数和两样本率比较时所需样本含量。结果:应用软件PASS 11和所给的公式计算中,两样本均数比较时结果相等,两样本率比较时非劣效性检验所需样本含量为111例,等效性检验所需样本含量为154例,与软件结果(分别为112、154)也是非常接近。结论:相同的准确度下,该文章中介绍的公式计算简单、实现方便、易被接受,实用性强;但PASS 11软件界面简洁、操作方便、结果输出更快。
【关键词】 非劣效性;等效性;样本含量;PASS
Sample Size Estimation and Software Implementation in Non-Inferiority/ Equivalence Tests
CHANG Jing, YANG Yong-li ,SHI Xue-zhong ,CHANG Liang, PING Zhi-guang
(1. Department of Health Statistics, College of Public Health, Zhengzhou University, Zhengzhou 450001,China;
2. Henan Centre for Disease Control and Prevention)
【Abstract】Objective:To realize sample size estimation and software implementation in non-inferiority/ equivalence tests with standard therapy for comparison. Methods:Using PASS 11 and related calculation formula calculate sample size of two sample means and two sample proportions by CaseStudy.Results: The two sample means were equal by using PASS 11 and the formula given. Comparing the two sample proportions, sample size required for non-inferiority tests was 111 cases, and sample size required for equivalence tests was 154 cases, which the result was very close to software(respectively112/154). Conclusion:Under the same accuracy, the formula described in this article was simple, easily achievable, easily acceptable, and practical; while for PASS 11, its software interface is simple, easy to operate, and output faster.
【Key words】Non-inferiority;Equivalence;Sample size;PASS
设计一项非劣效性/等效性试验必须考虑统计学方面中样本含量的计算这一重要问题,其中主要是基于终点变量和效应测量方面[1]。非劣性检验(non-inferiority tests)是试验药的治疗效果在临床上不劣与对照药。等效性检验(equivalence tests)是确认两种或多种药物治疗效果的差别在临床上可以接受的限度之内。确定样本含量大小的基本原则是在保证研究结论具有一定可靠性和精确度的前提下,选择最少的试验或调查对象例数。本文将着重探讨试验与标准治疗组对比时非劣效性/等效性检验中样本含量估算的公式,以及在PASS(Power Analysis and Sample Size)软件中的实现,期待对将来越来越多的非劣效性/等效性试验中样本含量估算有所帮助。
1公式介绍
1.1两样本均数比较时 ,样本含量估算公式为:
非劣性检验:(1)
等效性检验:(2)
其中 为样本含量,、 为单侧标准正态临界值, 双侧标准正态临界值, 是估计的共同标准差, 是等效标准(界值) 。非劣性检验为单侧检验,因此为β单侧概率,等效性检验为双侧检验,因此β为双侧概率之和[2]。
1.2两样本率比较时,样本含量估算公式为:
非劣性检验:(3)
等效性检验:(4)
其中 是平均有效率,其余指标含义同前。
2软件实现
2.1两样本均数比较时样本含量估算的PASS软件实现
【例1】一个新药AAA与对照药进行Ⅱ期临床检验,确认该新药不差于阳性药。根据以往的疗效和统计学的一般要求,取 , ,等效标准 ,已知两组共同标准差 ,每组需要多少病例?
2.1.1非劣性检验参数设置,见图一。
图一非劣性检验参数设置
结果显示非劣效性检验所需样本含量为112例,见图二。
图二非劣效性检验样本含量估算结果
2.1.2等效性检验参数设置,见图三。
图三等效性检验参数设置
结果显示等效性检验所需样本含量为155例,见图四。
图四等效性检验样本含量估算结果
若按照公式(1)和(2)计算:非劣效性检验所需样本含量为111例,等效性检验所需样本含量为154例,与软件结果非常接近。
2.2两样本率比较时,样本含量估算的PASS软件实现
【例2】一个新药AAA与对照药进行Ⅱ期临床检验,两组按照1:1设计,确认该新药不比对照药差。假设两药的疗效相同,采用临床治愈率作为终极标准。根据以往的疗效和统计学的一般要求, 取 ,功效( ): ,等效标准 ,治愈率 。每组需要多少病例?
将上述参数带入计算得到:非劣效性检验所需样本含量为88例,等效性检验所需样本含量为122例。
3讨论
PASS是Jerry开发的专业用于样本含量估计和效能分析软件,该软件内容丰富,专业性很强,能对数十种统计学检验条件下的检验效能和样本含量进行估计,且软件界面友好,操作简单,只需要輸入相应的参数,即可实现对样本含量及检验效能的预测[3]。
该研究利用PASS,进行了非劣效性/等效性检验中样本含量的计算,结果表明,当其它参数一样时,不管是两独立样本均数还是率比较时,采用非劣效性检验比等效性检验更节省样本含量。因此,在研究设计当初必须确定假设检验的类型。如果确认新药不会比标准药效果差,则采用非劣性检验;如果不确定新药的效果是否比标准药好,则采用等效性检验[4]。一般认为等效性检验更为稳妥,因此也更为常用。
影响样本含量的主要因素有[5]:(1)第一类错误的概率 ,值越小,所需样本含量越多, 通常取单侧0.05。(2)检验功效(1-β),(1-β)取值越大,所需样本含量就越多,把握度(1-β)在0.8以上为宜。(3)等效标准 (界值), 越大,所需样本含量越小。(4)总体标准差 , 越大,所需的样本含量就越大。
参考文献
[1] 袁小红,庄严,陈平雁.两均数比较的优效性/等效性和非劣效性验证的样本量估计[J]. 中国新药杂志,2009,18(23):2205-2209.
[2] 孙振球,徐勇勇,等.医学卫生统计[M].北京:人民卫生出版社,2010.564-568.
[3] 吴圣贤,王成祥,林炳辉,等.临床研究样本含量估算[M].北京:人民卫生出版社,2008.1-2.
[4] 刘玉秀,姚晨,陈峰,等.非劣效性/等效性试验的样本含量估计及把握度分析[J].中国卫生统计,2004.21(1):31-35.
[5] 郑青山、孙瑞元、陈志扬,等.新药临床非劣性及等效性试验中的例数估计和等效标准[J].中国新药杂志,2003.12(5):368-370.
【关键词】 非劣效性;等效性;样本含量;PASS
Sample Size Estimation and Software Implementation in Non-Inferiority/ Equivalence Tests
CHANG Jing, YANG Yong-li ,SHI Xue-zhong ,CHANG Liang, PING Zhi-guang
(1. Department of Health Statistics, College of Public Health, Zhengzhou University, Zhengzhou 450001,China;
2. Henan Centre for Disease Control and Prevention)
【Abstract】Objective:To realize sample size estimation and software implementation in non-inferiority/ equivalence tests with standard therapy for comparison. Methods:Using PASS 11 and related calculation formula calculate sample size of two sample means and two sample proportions by CaseStudy.Results: The two sample means were equal by using PASS 11 and the formula given. Comparing the two sample proportions, sample size required for non-inferiority tests was 111 cases, and sample size required for equivalence tests was 154 cases, which the result was very close to software(respectively112/154). Conclusion:Under the same accuracy, the formula described in this article was simple, easily achievable, easily acceptable, and practical; while for PASS 11, its software interface is simple, easy to operate, and output faster.
【Key words】Non-inferiority;Equivalence;Sample size;PASS
设计一项非劣效性/等效性试验必须考虑统计学方面中样本含量的计算这一重要问题,其中主要是基于终点变量和效应测量方面[1]。非劣性检验(non-inferiority tests)是试验药的治疗效果在临床上不劣与对照药。等效性检验(equivalence tests)是确认两种或多种药物治疗效果的差别在临床上可以接受的限度之内。确定样本含量大小的基本原则是在保证研究结论具有一定可靠性和精确度的前提下,选择最少的试验或调查对象例数。本文将着重探讨试验与标准治疗组对比时非劣效性/等效性检验中样本含量估算的公式,以及在PASS(Power Analysis and Sample Size)软件中的实现,期待对将来越来越多的非劣效性/等效性试验中样本含量估算有所帮助。
1公式介绍
1.1两样本均数比较时 ,样本含量估算公式为:
非劣性检验:(1)
等效性检验:(2)
其中 为样本含量,、 为单侧标准正态临界值, 双侧标准正态临界值, 是估计的共同标准差, 是等效标准(界值) 。非劣性检验为单侧检验,因此为β单侧概率,等效性检验为双侧检验,因此β为双侧概率之和[2]。
1.2两样本率比较时,样本含量估算公式为:
非劣性检验:(3)
等效性检验:(4)
其中 是平均有效率,其余指标含义同前。
2软件实现
2.1两样本均数比较时样本含量估算的PASS软件实现
【例1】一个新药AAA与对照药进行Ⅱ期临床检验,确认该新药不差于阳性药。根据以往的疗效和统计学的一般要求,取 , ,等效标准 ,已知两组共同标准差 ,每组需要多少病例?
2.1.1非劣性检验参数设置,见图一。
图一非劣性检验参数设置
结果显示非劣效性检验所需样本含量为112例,见图二。
图二非劣效性检验样本含量估算结果
2.1.2等效性检验参数设置,见图三。
图三等效性检验参数设置
结果显示等效性检验所需样本含量为155例,见图四。
图四等效性检验样本含量估算结果
若按照公式(1)和(2)计算:非劣效性检验所需样本含量为111例,等效性检验所需样本含量为154例,与软件结果非常接近。
2.2两样本率比较时,样本含量估算的PASS软件实现
【例2】一个新药AAA与对照药进行Ⅱ期临床检验,两组按照1:1设计,确认该新药不比对照药差。假设两药的疗效相同,采用临床治愈率作为终极标准。根据以往的疗效和统计学的一般要求, 取 ,功效( ): ,等效标准 ,治愈率 。每组需要多少病例?
将上述参数带入计算得到:非劣效性检验所需样本含量为88例,等效性检验所需样本含量为122例。
3讨论
PASS是Jerry开发的专业用于样本含量估计和效能分析软件,该软件内容丰富,专业性很强,能对数十种统计学检验条件下的检验效能和样本含量进行估计,且软件界面友好,操作简单,只需要輸入相应的参数,即可实现对样本含量及检验效能的预测[3]。
该研究利用PASS,进行了非劣效性/等效性检验中样本含量的计算,结果表明,当其它参数一样时,不管是两独立样本均数还是率比较时,采用非劣效性检验比等效性检验更节省样本含量。因此,在研究设计当初必须确定假设检验的类型。如果确认新药不会比标准药效果差,则采用非劣性检验;如果不确定新药的效果是否比标准药好,则采用等效性检验[4]。一般认为等效性检验更为稳妥,因此也更为常用。
影响样本含量的主要因素有[5]:(1)第一类错误的概率 ,值越小,所需样本含量越多, 通常取单侧0.05。(2)检验功效(1-β),(1-β)取值越大,所需样本含量就越多,把握度(1-β)在0.8以上为宜。(3)等效标准 (界值), 越大,所需样本含量越小。(4)总体标准差 , 越大,所需的样本含量就越大。
参考文献
[1] 袁小红,庄严,陈平雁.两均数比较的优效性/等效性和非劣效性验证的样本量估计[J]. 中国新药杂志,2009,18(23):2205-2209.
[2] 孙振球,徐勇勇,等.医学卫生统计[M].北京:人民卫生出版社,2010.564-568.
[3] 吴圣贤,王成祥,林炳辉,等.临床研究样本含量估算[M].北京:人民卫生出版社,2008.1-2.
[4] 刘玉秀,姚晨,陈峰,等.非劣效性/等效性试验的样本含量估计及把握度分析[J].中国卫生统计,2004.21(1):31-35.
[5] 郑青山、孙瑞元、陈志扬,等.新药临床非劣性及等效性试验中的例数估计和等效标准[J].中国新药杂志,2003.12(5):368-370.