论文部分内容阅读
目前,复杂性疾病遗传因素的研究日益成为研究的热点和焦点。随着对人类基因组结构与变异认识的深入,将不断加深人类对这些因素的认识和理解。单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)是基因组中多态性的主要形式,第三代遗传图谱,即SNPs图谱的提出为复杂性疾病的研究提供了丰富的素材。 实验技术的发展及复杂性疾病研究的需要,导致大量SNPs以及基因型数据的产生。如何利用和挖掘这些数据中潜在的遗传信息,发展有效的理论方法已经刻不容缓。连锁不平衡(linkage disequilibrium,LD)被认为是对疾病基因精细定位或者通过全基因组关联研究进行复杂性疾病作图研究的一种有效工具。然而,这种方法依赖于基因组中LD的模式及范围的描述。为了可视化候选基因组区域的LD模式及范围,我们开发了常染色体SNPs基因型数据分析的软件,即LDA(linkage disequilibrium analyzer),用于可视化候选基因组区域的LD模式及范围。 从2001年开始,通过对大量实验数据的分析,同时伴随着在实验方法上对重组现象认识的进展,有研究者认为人类的基因组是由一系列的单倍型块(haplotype block)所组成。单倍型块及单倍型标签SNPs(haplotype tagging SNPs)概念的提出,使研究者的目光转向了基于单倍型块及htSNPs的关联研究。基于这样的背景,我们开发了另一个用于可视化候选基因组区域的单倍型块结构与htSNPs选择的软件,即htSNPer(haplotype tagging SNPer)。 随着人类基因组计划的逐步完成,新一代的基因组尺度的图谱,即单倍型图谱,目前正在进行之中(HapMap计划)。HapMap计划的一个重要目标是,确定人类基因组中的DNA序列变异的共同模式(common pattern)。简言之,确定一百万或者更多的序列变异的基因型、相应的频率及变异之间关联的程度(LD水平)。已经发展了几种不同的方法用于描述单倍型中存在的高LD区域,单倍型块分析是其中的一个方法。目前,已有几种计算算法用于单倍型块的划分。然而,对这几种不同的单倍型块定义方法在单倍型块划分与htSNPs选择等行为上的了解并不深入。我们对不同的群体遗传学参数条件,两种不同的重组模型(均一重组的coalescent模型与重组热点的