合并印记效应和母体效应的广义不平衡检验分析方法研究

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:xuguanghong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:  关联分析是一种通过标记位点来定位疾病位点的方法,被广泛应用于病例对照数据和家系数据。如果标记位点距离疾病位点很近,这样就会导致连锁不平衡,关联分析就是以位点间连锁不平衡为基础,在获得群体表型数据与基因型数据后,采用统计分析方法检测遗传多态性与性状可遗传变异之间的关联,目的是利用标记位点与疾病位点之间位置的关系来定位变异基因。在诸多针对双等位基因位点的关联分析方法中,基于家系数据的广义不平衡检验(GDT)是一种稳健有效的方法。因为使用了家系内所有亲属对基因型差异的信息,所以GDT方法比其他现有的关联分析方法检验效能更高,但是GDT不能直接被用于存在基因型缺失的家系数据。遗传印记效应(genomic imprinting effects)是一种重要的表观遗传学现象,对研究基因对表型的影响有着非常重要的作用。该效应表现在后代基因的表达程度取决于此基因所在染色体来自父亲还是母亲。如果来自父亲染色体上的基因表达,而来自母亲的基因没有表达,则称为母源印记;相反,来自母亲染色体上的基因表达了,而来自父亲的没有表达,则称为父源印记。存在遗传印记效应时,两种有序杂合子基因型的外显率是不同的。常染色体上常见的与印记基因有关的疾病有:Beckwith-Wiedemann综合征、Silver-Russell综合征、假性甲状旁腺功能减退症和暂时性新生儿糖尿病。因此,将印记效应合并到关联分析中就变得越来越重要。另外,合并印记效应的家系传递不平衡检验(PDTI)及适用于不完整家系数据基于Monte Carlo(MC)重抽样方法的MCPDTI方法明显比没有合并以及效应信息的家系传递不平衡检验(PDT)的检验效能高。这也说明在关联分析过程中有必要合并印记效应的信息。但是与GDT相比,PDTI和MCPDTI都仅仅运用了家系内一级亲属对基因型差异的信息,这可能会降低两种方法的检验效能。  另外一种常见的表观遗传学现象为母体效应(maternal effect),此效应是指生物的表现型不仅由其本身的基因和环境决定,而且还会受到其母亲基因型和表型的影响。在遗传学中,母体效应之所以关注的是个体的表现型预期受到母亲基因型的影响,而无论个体本身的基因型是什么,通常是因为母亲将mRNA或者蛋白质传递给了胚胎。基于母体效应的作用机制,许多疾病,特别是那些与妊娠结局有关的疾病,已经发现会受到母体效应的影响,比如儿童癌症的脊柱部、精神分裂症和高血压。虽然遗传印记效应和母体效应有不同的生理过程,但是它们可能会产生相同的表型变异。因此,将遗传印记效应和母体效应同时合并到现有的关联分析的方法中是十分有价值的。然而,现有的GDT方法没有合并遗传印记效应与母体效应。  目的:  本文的研究目的主要有以下三点:(1)基于Monte Carlo重抽样方法对GDT方法进行推广,提出适用于某些个体基因型缺失的不完整家系数据的MCGDT方法;(2)在完整家系数据的情况下,提出合并印记效应的广义不平衡检验(GDTI),在不完整家系数据的情况下,使用Monte Carlo重抽样方法对GDTI方法进行推广并提出MCGDTI方法;(3)提出完整家系数据下同时合并印记效应和母体效应的广义不平衡检验(GDTIM)及适用于不完整家系数据基于MonteCarlo重抽样方法的MCGDTIM方法。  方法:  (1)对于存在基因型缺失的家系数据,通过使用MC重抽样方法根据给定的或者观测到的固个体基因型对缺失基因型进行反推,并提出MCGDT方法。进一步使用模拟出的第一类错误率来评价MCGDT的有效性,并通过检验效能的比较来说明其能够准确地反推出缺失基因型。  (2)对于完整的家系数据,为了将遗传印记效应合并到关联分析中,根据等位基因来自父亲还是母亲,将等位基因得分分解为两个等位基因得分之和,即XiJ=X(p)ij+X(m)lj,其中X(p)ij∈(0,0.5,1)为来自父亲等位基因得分;x(m)ij∈(0,0.5,1)为来自母亲等位基因得分。基于分解后的等位基因得分,提出合并遗传印记效应的广义不平衡检验(GDTI)。当家系中某些个体基因型缺失的时候,根据每个家系中观测到的基因型,运用MC重抽样方法来对缺失的基因型进行反推,并在此基础上提出MCGDTI方法。使用模拟出的第一类错误率来评价GDTI和MCGDTI的有效性,并通过比较新提出方法与现有的考虑所有亲属对基因型差异信息但并未合并印记效应的GDT方法以及合并了印记效应但仅利用了家系内一级亲属对基因型差异信息的MCPDTI方法的检验效能来说明两种方法的优势。真实数据运用方面,将新提出的方法运用于来自北美的类风湿关节炎的基因数据。  (3)对于完整的家系数据,将母亲的基因型得分纳入回归模型中,并提出同时合并印记效应和母体效应的广义不平衡检验(GDTIM)。对于存在基因型缺失的家系数据,提出MCGDTIM方法。此方法基于给定的或者根据观测到的奠基者的基因型信息来估计人群中等位基因频率,并使用MC重抽样方法反推家系中缺失的基因型。通过模拟出的第一类错误率来评价GDTIM和MCGDTIM方法的有效性,并基于检验效能的差异来说明GDTIM和MCGDTIM方法的优势。  结果:  (1)在不同的样本量、基因型缺失和多种家系结构等情况下,对所提出的MCGDT方法进行模拟研究。模拟结果显示,在没有关联的原假设情况下,MCGDT方法能够很好地控制第一类错误率。同时,MCGDT方法能够捕获大部分缺失基因型信息。  (2)在不同的样本量、基因型缺失、家系结构和遗传印记效应模型等情况下,对所提出的方法进行模拟研究。模拟结果显示,在没有关联和没有遗传印记效应的原假设情况下,GDTI、MCGDTI和MCGDT都能够很好地控制第一类错误率。检验效能的模拟结果表明,在遗传印记效应存在的情况下(完全遗传印记效应模型和不完全遗传印记效应模型),GDTI和MCGDTI方法的检验效能明显比现有方法高。当遗传印记效应不存在时,GDTI和MCGDTI方法的检验效能与GDT方法的检验效能很接近但仍比MCPDTI方法检验效能高。真实数据分析结果表明,与现有方法相比,MCGDTI方法能够识别出更多与类风湿关节炎存在统计学意义上关联的位点。  (3)基于遗传印记效应与母体效应(存在和不存在)的不同组合、不同的样本量、多种家系结构及疾病类型(常见疾病和罕见疾病),对所提出的方法进行模拟研究。研究结果显示,当没有关联、没有遗传印记效应和没有母体效应时,新提出的GDTIM和MCGDTIM方法能够很好地控制第一类错误率。检验效能的模拟结果表明,在两种表观遗传学现象都存在或者仅有母体效应存在情况下,本研究提出的GDTIM和MCGDTIM方法在检验效能上有较明显的优势。当遗传印记效应存在而母体效应不存在时,虽然MCGDTIM方法的检验效能与MCGDTI方法的检验效能很接近,但是与MCGDT方法的检验效能相比,MCGDTIM方法的检验效能高很多。在两种表观遗传学现象均不存在时,MCGDTIM和MCGDTI方法均有与GDT很接近的检验效能。  结论:  (1)为了能够将GDT应用于某些个体基因型缺失的不完整家系数据,使用MC重抽样方法对GDT进行推广,并提出了MCGDT方法。模拟结果说明,MCGDT能够反推出大部分的缺失信息。因此,在实际应用中推荐使用MCGDT。  (2)本研究通过将个体的基因型得分分解为来自父亲等位基因得分与来自母亲等位基因得分之和的形式,将遗传印记效应信息合并到关联分析中。与仅使用家系内一级亲属对基因型差异信息的MCPDTI方法相比,GDTI方法充分使用了家系中所有亲属对基因型差异的信息,因而有更高的检验效能。针对不完整家系数据,通过使用MC重抽样方法对GDTI进行了推广,并提出MCGDTI方法。模拟结果说明,由于合并了遗传印记效应的信息,GDTI和MCGDTI比现有方法拥有更高的检验效能。类风湿关节炎数据的分析进一步说明MCGDTI比其他方法更有优势。因此,GDTI和MCGDTI有更强的实用性。  (3)在本研究中,将遗传印记效应和母体效应同时合并到GDT过程中,并提出GDTIM方法。在合并遗传印记效应信息时,采取与GDTI相同的处理方式,根据等位基因来自父亲还是来自母亲对个体基因型得分进行分解,并定义了新的等位基因得分。在合并母体效应信息时,选择将个体母亲基因型得分纳入模型中。针对家系中出现某些个体基因型缺失的情况,根据MC过程对GDTIM方法进一步推广,并提出了MCGDTIM方法。模拟结果显示,在没有关联、没有遗传印记效应和没有母体效应的原假设下,GDTIM方法和MCGDTIM方法能够很好地控制第一类错误率。在遗传印记效应和母体效应均存在的情况下或者仅有母体效应存在的情况下,由于合并了遗传印记效应和母体效应并使用所有亲属对基因型差异信息,所以在所有检验的关联分析方法中MCGDTIM方法有最高的检验效能。同时,模拟研究也说明,MCGDTIM方法更适用于不完整家系数据。在遗传印记效应存在而母体效应不存在时,相对仅合并了印记效应的MCGDTI方法,MCGTIM方法合并了并不存在的母体效应信息,所以MCGDTIM方法的检验效能较低。但是,与MCGDT方法相比,MCGDTIM方法合并了正确的遗传印记效应信息,因此其检验效能比较高。当两种表观遗传学现象均不存在时,MCGDT方法有更高的检验效能。
其他文献
在苏联的帮助下,古巴在蓬塔戈尔达市建成了制镍工厂并对在尼卡洛和毛阿的各工厂进行改造。但是,现有露天采场的矿石储量将在2000年采完。因此,目前正在进行从毛阿东新矿床输
“大跃进”运动发动前后,西方国家对我国施加封锁和包围,新中国与西方资本主义国家及社会主义的苏联在经济和社会发展方面存在巨大差距,社会主义阵营出现赶超热潮,这样的国际
棉花规模化转基因技术体系由国家转基因植物研究与产业化开发专项资助,旨在培育转基因棉花新品种及其产业化提供育种材料基础和技术保障等。该体系2002年6月17日通过农业部组
1 前言以往,丰羽矿采用分段法开采薄矿脉。现在,则引进了潜孔钻机作为采矿凿岩设备。其目的是:①用钻凿更高精度的炮孔按矿脉宽度完全回采,以降低矿石贫化率;②提高凿岩爆破
有15家以上的公司在积极地推销用于储量评估、矿山设计和采矿计划的计算机软件。构模技术以及矿山规划方法因软件销售商的不同以及他们对矿体应如何去模拟的观点不同而异。本
各采选公司采用的尾矿水力输送工艺是一种复杂而又昂贵的工艺,需要大量的资金,建设专用的水工构筑物,如:筑坝、矿浆泵站和水泵站、多条矿浆管道和水管道以及构筑尾矿库的排
目前,许多国家都在研究用射线测煤炭灰分的技术,澳大利亚、日本、西德先后都有双射线灰分仪投向市场。这种灰分仪的性能指标均优于单射线反散射式。国营262厂利用核电技术与
在磁铁石英岩的选别工艺流程中,磁选前要对水力旋流器的分级溢流进行脱泥,以便在磁选前浓缩磨矿产品并从中将矿泥和贫连生体排入脱泥机溢流中。只有形成相应的上升矿浆流并
詈语就是骂人的话,作为一种语言现象,研究得十分不够.“痞子”王朔的小说里包含着有限但数量极多的詈语,反映了现实生活中詈语世界的丰富多彩.詈语可分为贬称对方为动物或物
目的分析术后病理Ⅰ_A期非小细胞肺癌患者的临床病理特征,探讨影响其预后的危险因素。方法回顾性分析我科1993年1月至2012年12月术后病理证实为Ⅰ_A期的非小细胞肺癌患者138