千人基因组计划低覆盖度项目SNPs统计分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:angelboy8100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国际千人基因组计划将补充完善包括SNPs(single nucleotide polymorphisms)、拷贝数突变(copy number variants)和短插入缺失突变(short insertions and deletions)等三类人类常见的遗传突变类型,为人类遗传学和医学研究提供资源。其第二个先导项目,即低覆盖度项目已完成了来自三个不同种群(CHBJPT,CEU和YRI)的179人的低覆盖度全基因组测序,平均测序深度为3倍。本论文对第二先导项目最终发布的SNPs数据进行统计分析,并结合群体遗传学理论和数学统计方法对数据所揭示的生物学意义进行了初步研究。通过对SNPs数量进行分类统计,我们发现,对于种群、染色体、突变类型、MAF(minor allele frequency),SNPs的数量上都具有不同的分布;而对于不同染色体、突变类型、MAF,SNPs的数量分布在不同的样本种群之中都具有比较好的一致性;每个样本种群中每一方面类型的SNPs数量与样本种群总数之比基本相等,这说明SNPs在这几个方面的数量分布与种群有关,而其数量与总数的比值与种群无关。YRI样本种群中的SNPs数量在各方面都为最多。并且其参考序列与祖先序列相同的SNPs数量也是最多,达到总数的69%。以上都与人类祖先源于非洲的结论吻合。本文运用Tajima D检验、Fu&Li D检验、Fu&Li D*检验和修正Fw检验四种不同的中性检验方法对三个样本种群染色体的每一个片断进行检验,并分析每一检验结果,研究其分布。根据这四个检验结果,我们发现,三个种群染色体区域大部分都未偏离中性突变。最后,分别利用Fu、Watterson和Taiima三种方法对每个样本种群染色体的每一片断的θ值进行了估计,得到各个θ值在不同种群的分布图。结果表明,Fu、Watterson、和Taiima估计方法对三个种群估计出的频率最多的θ值几乎是相同的,按CHBJPT,CEU,YRI三个样本种群依次分别都为:5、5、7。在这三个方法中,Fu的方法得出的θ值范围最窄,均值最小,为最佳方法。
其他文献
认知神经科学的研究是为了揭示大脑的认知原理,而通过功能磁共振成像技术可以比较直观的观测出大脑在受到外界刺激时脑功能的变化。机器学习方法能够从脑活动记录的图像数据中
经济的繁荣促使汽车以前所未有的速度进入到人们的生活,为了满足人们对汽车智能化和安全性的追求,汽车行业正在向高智能化发展,而该智能化离不开语音技术的支持。近年来,Siri
本文通过对荣华二采区10
固相萃取仪是广泛应用于化学分析的仪器,其主体部份是由三个直流电机驱动的三维运动装置。本文的目的在于开发和设计其运动控制器的电路和控制软件。由于传统的基于单片机的萃
当今世界已经进入到飞速发展的信息时代,而在这信息时代中通信特别是移动通信是发展最为快速的产业。以民用陆地移动通信为例,已经从20世纪80年代初的第一代模拟蜂窝移动通信系
人胞质亮氨酰-tRNA合成酶(hcLeuRS)是人细胞中氨基酰-tRNA合成酶复合物(Multi-synthetase Complex,MSC)的一个组分。人胞质aaRS的研究对药物筛选和了解它的其它非经典功能非常
从教育心理学的角度看,学生作业出错的原因主要是学生感知缺乏整体性、注意缺乏全面性、记忆缺乏持久性、思想缺乏深刻性。另外,教师方面有时也存在一些问题,比如讲授缺乏严密性
芽孢杆菌(Bacillus spp.)的一些种类对植物病虫害具有良好的生防活性。在微生物农药的研发和应用中,剂型是影响生物农药防治效果和市场前景的关键要素之一。Mo-Ba和Mo-Bm菌株
自适应滤波器的硬件实现一直是自适应信号处理领域研究的热点。随着电子技术的发展,数字系统功能越来越强大,对器件的响应速度也提出更高的要求。 本文针对用通用DSP 芯片实
目前我国暖室内植保机械应用最广的仍为手动背负式喷雾器,这种喷雾器的喷雾方法施药技术粗放,农药浪费现象严重、作业幅宽窄、射程近,并且劳动强度大、工效低,操作者在密闭的空间