论文部分内容阅读
随着现代生物学技术的发展,已经有千余位点单核苷酸多态性与复杂疾病关联被成功识别.本文首先按照从考虑单个位点到考虑多个位点的顺序回顾了全基因关联分析中的统计方法,介绍完成论文所需要的统计遗传、概率论与数理统计、统计计算等领域的一些预备知识.接下来,本文提出了适合三个具体问题的基因关联分析的统计检验方法,研究了统计方法的理论分布与性质,并通过R软件实施统计模拟和进行实际数据分析,数值结果均验证了我们所提出的检验方法具有某种稳健性.具体如下:在第三章中,本文推广了包含一个冗余参数的MERT检验到包含多个冗余参数的情形,并研究了包含多个冗余参数的MERT检验存在的一些正则条件及包含多个冗余参数MERT检验的一些统计理论性质.当多个基因位点连锁平衡且在基因遗传模型未知的情形下,本文推导了 MERT检验的具体形式,并研究其大样本性质.通过大量模拟研究,论证了这种检验对基因遗传模型未知具有稳健性.在第四章中,本文利用现代统计方法与数据分析技术提出了一种针对数据高维(大量基因位点)、哈代-温伯格平衡律成立与否未知、真实基因位点遗传模型未知都具有稳健性的统计检验方法,并将该方法应用在多个连锁不平衡位点的基因关联分析中,模拟研究与实际数据分析都证实了本文所提检验方法的稳健性.然后,在第五章中,本文初步探讨了基因关联分析中一种检测基因多效性的统计检验方法,提出了一种统计检验方法来检验二元有序离散取值的响应变量与连续取值的响应变量同时与一个协变量(向量)之间的关联性.当有序离散取值响应变量与连续取值响应变量的相关性不是很弱时,本文所提出的统计检验方法总是比传统的组合P-值检验方法功效更高.通过大量模拟研究与一个实际的医学数据分析证实了本文所提统计检验方法的优越性.最后,本文全面分析总结所开展研究工作的创新之处及主要优缺点,以及今后还要继续开展的一些研究工作.