论文部分内容阅读
病例对照方法是一种基于群体的抽样研究方法,并在流行病学、统计遗传学等诸多研究领域得到广泛的应用。早期病例对照研究多用于研究基因与环境之间的互作。近年来,病例对照研究方法常被用来寻找与癌症,糖尿病等疾病相关的致病因子。然而,研究者们发现当病例对照方法应用于基因与疾病的相关分析时,大量的研究结果不能被重复。有人主张使用家系连锁分析方法纠正病例对照研究产生的偏差,但是由于相关性研究的抽样方法更类似于在群体中随机抽样,并能提供更高的估计精度,因此在研究同一性状时病例对照研究比家系研究的把握度更高。前人多认为造成病例对照研究结果不能被重复的主要原因是选用了不恰当的样本,或者检测样本基因型时发生了基因型检测错误,却忽略了这些研究选用样本容量时的随意性。本研究认为需要的样本容量被低估也是研究结果不能被重复的重要原因之一,大部分研究由于样本容量不足而难以得到准确的研究结果。虽然部分研究者曾给出估计样本容量的方法,但由于其公式需要的已知条件过多,在实践中难以应用。本研究以寻找合理的样本容量和外显率参数估计方法为目的,通过大量的计算机模拟研究基因突变与疾病之间的关系,最终得到了估算样本容量的公式,并给出了估计外显率参数区间的方案。结果表明,本研究中采用的样本容量计算公式较传统病例对照研究中使用的Cohort方法或者家系研究所需的样本容量计算公式更适用于基因相关研究。本研究得到的计算公式考虑了基因频率对样本容量的影响,得到的样本容量远小于Cohort方法,对参数的估计精度优于家系研究方法,且相较Cohort方法,估计精度没有明显下降。Cohort方法和家系研究方法的必要参数在完成对病例组和对照组抽样前往往无法得到,而本研究仅通过病例样本的数据就能够得到必须的参数,且估计得到的参数重复率高,在实际研究中更有意义。另外,针对病例对照研究中广泛存在难以选择适合的对照样本的问题,本研究给出了仅使用病例样本估计群体基因频率及外显率参数的方法,可以将参数的取值区间限定在一个非常狭窄的范围内,避免了因为对照组数据质量低下而导致的参数估计偏差,也为正确估计基因与疾病间的互作关系奠定了扎实的理论基础。