论文部分内容阅读
目的:越来越多的研究显示一个个体的同源染色体(或相应的一对等位基因)因分别来自其父方或母方,而出现功能上的差异,因此当它们其一发生改变时,所形成的表型也有不同,这种现象称为遗传印记。对于二等位基因标记位点,C-PAT (combined parental-asymmetry test)方法是一种检验效能较高的检验定性性状遗传印记效应的方法。但是,该方法只利用了核心家庭中患病小孩的信息,而无法利用正常小孩的信息。本文通过合并核心家庭中正常小孩信息构造出新的统计量,充分利用所得到的家庭成员基因信息对遗传印记进行检验。另外,对于多位点相(phase)未知的基因型数据,单倍型推断起着重要的作用。在病例-对照研究中,人们已提出了单倍型与疾病的关联分析方法,但这些方法都要求多位点上的单倍型频率满足Hardy-Weinberg平衡律(HWE).目前,检验基于单倍型Hardy-Weinberg平衡律是否成立的常用方法是拟合优度检验。然而,当位点数目增加时,该方法的自由度将会急剧增加,从而大大地影响其检验效能。(1)对于定性性状的遗传印记检验方法,当父、母亲基因型都不缺失时,作者提出了PATU (parental-asymmetry test with both parents by incorporating unaffected children)检验方法。该方法将核心家庭中所有患病小孩与正常小孩的信息合并到检验中来。当父、母中有一人的基因型缺失时,作者提出了1-PATu (parental-asymmetry test with one parent by incorporating unaffected children)检验方法。将PATU与1-PATU方法进行合并,作者构造出C-PAT。统计量,C-PAL方法既适用于父、母亲基因型都不缺失的家庭数据又适用于父、母中有一人的基因型缺失的家庭数据。(2)我们分别引入Niu模型(NM模型)与亲缘系数模型(IM模型),该两种模型都各有一个用于衡量HWE是否成立的参数。另外,根据所收集到的样本数据建立观察数据的似然函数与对应模型下完整数据的似然函数。为了估计参数,分别用EM算法与ECM算法进行极大似然估计,进而,建立基于NM模型的似然比统计量LRT1与基于IM模型的LRT2统计量,用于检验基于单倍型的HWE是否成立。结果:(1)模拟研究显示C-PATu统计量在无遗传印记的零假设下能很好地控制犯第Ⅰ类错误的概率;当遗传印记效应存在时,C-PATU统计量的检验效能比现有检验方法的检验效能要高很多。将C-PATu方法运用到Framingham心血管疾病数据,其结果进一步验证了C-PATu方法的优势。(2)我们模拟了HWE、NM、IM与人群分层四种模型。模拟结果显示,在单倍型频率估计方面,EM算法与基于亲缘系数模型的单倍型推断方法估计效果相似,而基于Niu模型的单倍型推断方法估计只在Niu模型的模拟背景下才优于前两种方法。而对于两种基于单倍型推断的HWE检验方法,基于Niu模型的似然比检验方法能有效地控制第Ⅰ类错误率,而基于亲缘系数模型的似然比检验方法比较保守。另外,除了Niu的模型之外,基于亲缘系数模型的似然比检验方法的检验效能比基于Niu模型的似然比检验方法的检验效能要高。结论:(1)通过合并核心家庭中正常小孩信息得到的新的统计量C-PATu能有效地控制犯第Ⅰ类错误的概率,其检验效能改善很多,从而能更加有效地检验致病基因是否具有遗传印记效应。(2)两种基于单倍型HWE检验方法都能有效地控制第Ⅰ类错误率;我们推荐LRT2似然比检验方法用于检验基于单倍型的HWE。