罕见变异关联分析中的统计方法研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:greatspy_52
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过去十多年来,基于“常见疾病常见变异”(common disease commonvariant,CDCV)假设,全基因组关联分析(genome wide association studies,GWAS)技术已经识别出大量与复杂疾病(性状)相关联的常见变异(commonvariant,CV),但这些识别出的常见变异一般只能解释至多5%-10%的整体遗传度,表明GWAS存在一定的缺陷。近年来研究方向开始转向探测罕见变异(rare variant,RV)与复杂疾病(性状)的关联。目前,已经有一些研究结果证实罕见变异在复杂疾病(性状)关联分析中具有重要作用。  尽管罕见变异可能在关联分析中具有重要的作用,但目前针对罕见变异的关联检验方法还不是非常普遍,其中一个重要的原因在于,罕见变异的低频率使得现有针对常见变异的一些统计检验方法的功效不佳。基因组内部罕见变异的遗传结构和复杂疾病(性状)的遗传机制都非常复杂,尚没有完全的掌握,因此,各种研究方法相继涌现,相关研究还处于起步阶段。随着二代测序(next-generation sequencing,NGS)数据的大量产生,使得探测复杂疾病(性状)与罕见变异的关联成为可能,但能否探测到与复杂疾病(性状)相关联的罕见变异,很大程度上将取决于针对罕见变异的统计方法的功效,因此当前迫切需要发展新的针对罕见变异的稳健高效的统计分析方法。  本文第一章,系统总结和梳理了现有的一些针对罕见变异的统计分析方法,指出了这些方法的优缺点以及适用范围,并结合最新的研究进展展望了未来的发展趋势。同时,给出了全文的研究内容和结构。  在第二章中,针对一个具有代表性的关联检验方法——求和检验(Sumtest)进行分析,发现求和检验的假设不太合理,存在可以改进的地方。进而利用分块思想,提出了一个基于连锁不平衡(linkage disequilibrium,LD)分块的求和检验方法LDBST(LD block-based sum test)。通过模拟数据分析,对比了该方法与其他几种常规方法的功效,经验结果显示,利用分块信息,LDBST方法在一些场合具有较高的功效。  在第三章中,继续利用分块思想,针对最近提出的一类基于Kullback-Leibler距离的检验方法KLT进行分析,提出了两个基于分块的KLT检验方法,分别称之为bKLTmax和bKLT。这两个检验方法可视为原始KLT方法的推广。通过设置多个不同场合和情形,对比分析了bKLTmax和bKLT方法与其他三个方法KLT、SSU和SKAT-O的Ⅰ类错误率和功效。数据分析结果显示,在检测区域出现了遗传变异聚集的情形下,bKLTmax和bKLT方法可以显著提高检验的功效。与此同时,对可能出现的遗传区域内真实的分块情形被错分的情况,进行了稳健性分析,计算结果显示,bKLTmax和bKLT方法具备良好的稳健性。  在第四章中,针对实际分析中遗传区域分块通常未知的情形,结合DallasHeart Study测序数据,提出了一种经验分块搜索程序,将Dallas Heart Study数据中的基因ANGPTL5划分成三个分块。基于这种经验分块程序所构造的分块,利用bKLT和bKLTmax这两种方法对基因ANGPTL5进行了分析。通过计算经验p值,展示了bKLT和bKLTmax这两种方法在真实数据分析上的优异表现。  第五章,对全文的研究内容和创新点进行了总结,并对未来的研究工作和研究方向进行了梳理。  综上所述,本论文基于对遗传区域进行分块的思想,针对几个常见的较为高效的罕见变异关联检验方法,提出了相应的基于分块的检验方法。模拟数据和真实数据的分析都显示,基于分块思想的检验方法比其对应的原始方法可进一步提高检验的功效。我们相信基于分块的思想,还可进一步推广到其他类似的检验方法当中。
其他文献
该文主要运用统计方法、数据挖掘技术和OLAP技术来研究中国商业银行分析型CRM的应用.全文分为七个部分:第一部分为引言,包括研究意义、研究现状、研究内容、研究的难点及解决
本文试图通过大连商品交易所的大豆和上海期货交易所的铜交易数据的研究实证的分析中国期货市场的定价效率是怎么样的,以及期货市场的定价效率与套利行为和套利成本之间的关
微处理器体系结构的发展经历了三个不同的阶段,以Intel早期X86产品为代表的CISC体系结构微处理器;以MIPS、PA-RISC、SPARC、ALPHA、PowerPC等为代表的RISC体系结构微处理器;
期刊
针对目标跟踪系统中由于目标机动产生的断裂航迹,提出了量测缺失下的航迹粘连算法和有量测情况下的航迹粘连算法.首先,对新起始的航迹进行平滑处理.然后,利用转弯模型对断裂
小学英语教学的目的是调动学生学习的积极性,让学生由愿意学习到喜欢学习,发展到积极主动地自主学习,从而培养学生的语言运用能力。从有效应用信息技术手段,优化课堂教学,激
期刊
该文将以现阶段中国微观经济主体的行为特征为研究重点,分析其行为改变对货币政策效应的影响,为货币政策制订提供有效的理论依据.该研究注重规范与实证方法的紧密结合.在论述
期刊
学位