标签SNP选择方法在全基因组关联研究中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:iorikof1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量基因分型技术的快速发展,全基因组关联研究已经成为检验复杂疾病关联性变体的一种非常重要的方法。科学家在进行全基因组关联研究时,通常会选择一个合适的SNP集(标签SNPs,简称为tagSNPs)进行关联分析和检测,这个SNP集既要含有全体原始SNP集的大多数信息,又要大大降低计算复杂性。目前使用的tagSNPs选择方法主要有两类:基于单体型块结构的tagSNPs选择方法和基于LD的tagSNPs选择方法。本文提出了基于宽度优先搜索和基于最大信息量的tagSNPs选择方法,并通过大量的仿真实验验证了两种方法的有效性。具体内容如下:  在基于宽度优先搜索的tagSNPs选择方法中,首先应用图论中的宽度优先搜索方法对单体型进行分组,连锁不平衡程度高的SNPs被分到同一个组中;然后在分好的组内搜索与组内SNPs连锁不平衡系数最大的SNP,作为tagSNPs。基于最大信息量的tagSNPs选择方法在分组策略上不同于上述方法,通过选取一个最大信息量的SNP,与最大信息量SNP连锁不平衡程度高的SNPs与这个最大信息量SNP放到同一个组中;然后按照上述方法迭代进行分组;最后在分好的组内基于SNPs之间的连锁不平衡系数寻找tagSNPs。  为了验证基于宽度优先搜索和基于最大信息量的tagSNPs选择方法的有效性,我们分别将这两种方法应用真实数据和仿真数据上,并比较基于tagSNPs进行疾病关联检验与基于原始SNP集进行疾病关联检验的P值、第I类错误率和功效。文中应用HapMap计划的CEU样本,选取基因MTRF1和基因PHGDH上的全部SNPs作为研究对象,所有仿真数据均由HAPGEN2产生。大量数据试验结果表明:基于宽度优先搜索和基于最大信息量的tagSNPs选择方法选择的tagSNPs可以用来进行疾病关联检验,并且在最大化SNPs提供的信息含量的同时,降低了基因分型的成本,减少了计算的复杂性。
其他文献
本文介绍了一些收敛理论的必备知识,考虑了定点与等变的Gromov-Hausdorff收敛,讨论了等变粘合度量空间,探讨了伪群及其群化,验证了它确实是一个度量,三角不等是比较显然的,验证非负
  风险理论,作为保险或精算数学的一个重要部分,研究对象是保险业务的随机模型和破产概率。经典的复合Poisson风险模型是一种基本的模型。在这种模型中,保险公司收到一定量的
目前,奇异Markov跳变系统不断成为一个重要的研究领域,它是一类具有Markov跳变参数的奇异系统.奇异Markov跳变系统被广泛应用于经济学、网络控制、生物工程以及航空航天等领
凸性是一个十分重要的数学概念,六十年代中期诞生的一门新的数学分支-凸分析,就是以凸集和凸函数为基本研究对象的,现已成为数学规划、变分学、最优化理论等学科的重要理论基础
椭圆曲线密码体制,即基于椭圆曲线离散对数问题的公开密钥密码体制,最早于1985年由N.Koblitz[1]和V.Miller[2]分别提出。椭圆曲线密码体制的安全性基于椭圆曲线离散对数问题的
填充函数算法是求解全局优化问题的有效方法之一,而滤子技术以其良好的数值效果广泛应用于局部优化算法中。为优化填充函数方法,本文首先提出一个基于滤子技术的填充函数算法用
本文利用空间平均法,将拟线性中立型抛物型方程组解的振动判别问题转化为时滞常微分不等式最终正(负)解的存在问题,获得了判别其解振动的充分条件,将中立型抛物方程的振动
  本文研究了正整数集直积上的最大公因子矩阵,并利用MObius反演和张量积理论对它的结构及其行列式的界进行了讨论,得到一系列了与正整数集上最大公因子矩阵的结构及其行列式
  本文主要研究一类拓广的Besicovitch集合及其Hausdorff维数,这类集合是与区间[0,1]的中实数x的c-进制(c大于或等于2的整数)展开式中对应于自然数集的一个划分的位置上备数
本文主要研究熵理论中的熵、独立性与回复集之间的联系,整数群作用下不变测度的条件熵公式以及可数离散无限的amenable群作用下遍历测度的相对化版本的SMB定理与条件熵公式。