基于微等分重叠混合的单倍体分型方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wang5632968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
已经有大量的研究结果表明单倍体可以用来研究人类迁移,进化选择和人口结构。通过检测家族内基因型之间的不一致性,单倍体还可以帮助检测和纠正错误或缺失的测序数据。此外,人体许多表型差异、对药物或疾病的易感性等与单倍体都相关。因此,对单倍体的分析极具意义。微等分单倍体分型是分子学构建法进行单倍体分型中的一种,该方法基本原理是将基因组DNA按照一定比例稀释,并将基因组DNA分配为多个等分试样。通过这样的操作来保证每个等分试样只接受一个单倍体拷贝的一部分,从而使得基因组的任何位置都可能由单倍体DNA片段代表。虽然目前已经有一些单倍体分型方法是基于微等分方法展开的,像DNA单分子酶扩增法单倍体分型,单分子稀释MDA扩增单倍体分型和DNA长片段的单倍体分型方法。但是目前并没有实验对微等分单倍体分型方法进行全貌的探索,像测序深度或者微等分的规模对单倍体分型结果的影响。此外要想获得纯净的单倍体微等分,需要微等分的核酸规模远小于一个单倍体基因组,如小于1%个单倍体基因组。然而,如果微等分的规模较小,将需要数量众多的微等分才能完成单倍体分型,这意味着建库成本和测序成本的大幅提升。基于以上两点,本文不仅从测序深度和微等分规模两个角度来对微等分单倍体分型实验进行探索,还将该实验与重叠混合原理进行结合,从每个池子中的同源片段中获取更多的信息,从而达到降低混合池子的数目,进而降低测序成本的目的。本文实验内容主要分为以下三个部分:1、从微等分单倍体分型实验过程入手,设计模拟每个池子生成的流程。通过通用的生物信息学流程分析,搭建对每个池子的生物信息学分析流程,以找出每个微等分的snp信息。结合长片段读取技术,对每个池子进行单倍体分型的流程。根据已经搭建好的模拟流程,进行预实验,测序深度选在2x和10x之间,并对预实验的单倍体分型结果构建评判标准。2、选取NA12878的4号染色体上长度为20M的DNA片段作为参考基因组,进行微等分单倍体分型模拟实验。每个微等分的DNA含量分别选取基因组的1%、2%、5%、10%、20%、50%,测序深度分别选取2x、3x、4x、5x、6x、7x、8x、9x、10x进行了54组实验,并对54组实验结果进行分析总结。从54组实验可以看出,在测序深度一定的条件下,随着每个等分里面DNA的百分比的减少,单倍体的分型率逐渐增加;在每个池子里面DNA含量一定的条件下,随着测序深度的增加,单倍体的分型率也逐渐增加,当测序深度达到6x时,单倍体的分型率开始达到95%左右了。在每个微等分中的DNA含量一定的条件下,随着测序深度的增加,N50的长度越来越大;同样地,在测序深度一定的条件下,随着每个微等分包含的DNA含量的减少,N50的值越来越大,但是和测序深度相比,测序深度对N50的影响更大。通过54组实验结果和三种评判单倍体分型的指标的关系,为分子实验提供了坚实的理论指导。3、在微等分单倍体分型模拟实验流程的基础上,结合重叠混合策略,设计了基于微等分单倍体分型模拟实验的整个流程。并且完成了12组基于微等分重叠混合单倍体分型的模拟实验,并且将其与基于微等分单倍体分型模拟实验的结果进行比较。在基于微等分单倍体分型模拟的54组实验结果当中,有6组实验结果的单倍体分型的分型率不低于95%的同时错误率低于0.1%,并且最低需要500个池子才能达到此标准。经过重叠混合方法之后,当测序深度为40x,每个混合池子里面DNA含量为0.5的条件下,仅仅使用80个混合池子就可以到达单倍体分型率高于95%,并且分型的错误率低于0.1%的要求,混合池子的数目大大降低。本文对微等分单倍体分型实验进行探索,找出测序深度和每个池子中的DNA含量对单倍体分型的影响,为分子实验提供了坚实的理论指导。并将该实验与重叠混合原理进行结合,降低了混合池子的数目,进而降低测序成本。
其他文献
新型功能性金属纳米粒子具有可设计的形貌尺寸和独特的光电特性,为微纳组装材料提供了广泛的构建基元,在柔性光电器件和表面增强拉曼散射(SERS)高灵敏检测等领域具有重大应用前景。近年来,不同维度的贵金属超晶格结构材料已被国内外科研人员相继报道并见诸于纳米材料领域的重要期刊,例如“手性纳米组装体”、“类聚合物链状阵列”以及“超晶格晶体”等一维-三维材料,多层级结构的精准构建以及新型功能性的可控设计成为了
随着码头使用年限的增长和码头不利环境作用的侵蚀,码头构件不断劣化,结构性能不断退化,在役高桩码头的整体性能安全问题不容轻视。开展高桩码头结构性能退化演变状态下的整体工作安全性研究,对在役高桩码头的使用安全与风险防控具有一定的理论意义和应用价值。本文对海洋环境中氯离子和应力联合作用下的高桩码头构件劣化与性能退化进行分析研究。结合高桩码头工程结构各构件刚度性能的退化分析,构建D-P桩土相互作用下的高桩
金融业作为百业之母,与所有的行业都深深交织在一起,蕴含着海量的金融文档。虽然技术不断发展,但这些数据收集、整理和写作的工作却还是依赖人力完成。如果能使用自动化技术来完成金融报告这个繁琐费时的工作,可以减少重复的手工体力劳动,帮助金融从业者提高工作效率,从而聚焦在更有价值的工作上。然而,将深度学习技术应用到报告生成的过程中,还存在着许多问题。首先,金融报告生成属于文本生成问题,传统使用基于模板的方法
活性氧(ROS)在细胞生命周期(例如增殖)中起着重要的作用,但是当ROS水平超过肿瘤细胞正常生理活动所需的阈值,会致使DNA、蛋白质失活,从而进一步导致细胞死亡。因此通过外源干预来打破细胞内ROS平衡状态是一种治疗癌细胞可行的策略。为了极大的提高肿瘤细胞的氧化效率,需要通过芬顿反应或类芬顿反应,并在芬顿试剂如铁(Fe2+)的存在下将H2O2转化为·OH。因此通过外源性增加细胞内H2O2的含量,或者
近些年,随着计算机技术和人工智能技术的发展,心电信号的自动分类方法日渐完善,其主要包括以下四个步骤:信号采集、信号预处理、信号特征处理、信号分类。信号采集主要指采用硬件设备获得原始心电信号,信号预处理主要指对原始信号去噪以及去除基线漂移等操作,信号特征处理指对于原始信号的特征进行提取、选择、融合等操作来突出不同类别信号之间的差异以获得更好的分类效果,信号分类是指采用分类器对特征处理后的信号实现分类
银行在信息化建设过程中,为了实现全行业务的统一核算和账户集中管理,都各自建立起了一套综合业务系统,但由于各银行信息化实施时间有先后,在设备选型、系统建设、技术运用、接口标准等方面难以形成统一,造成各地市信息化差异较大,并且银行内很多系统相互独立且内部耦合性较高,随着银行业务的高速发展,带来的系统维护成本也越来越高,难以匹配业务的发展速度。针对该问题,本文基于SOA技术,提出了一种解决银行异构系统间
大数据技术已经被广泛应用于医疗保健、保险业、政府、科学研究等领域,这些领域中的部分数据往往具有高度的敏感性。随着频繁暴露的隐私数据泄露问题,以及有关保护数据隐私的法律出台,使用Spark集群高效处理这些海量数据时,需考虑隐私数据的保护问题。本文考虑多数据中心下面向分布式隐私数据的Spark任务调度问题以优化工作流完工时间为目标,其主要挑战在于:(1)如何确保调度过程满足Spark工作流的隐私性约束
近些年来,随着第五代移动通信(5G)技术的蓬勃发展和人们对高速短距离通信需求的不断提升,毫米波(30~300GHz)由于具有波长短、频谱资源丰富等特点,成为了当今行业内学者研究的热点频段。CMOS工艺因其集成度高、低成本、工艺成熟、能与基带工艺相集成等优点,有着广大的应用前景。基于CMOS工艺的毫米波集成电路芯片越来越多地被设计出来。作为无线收发机的核心组成模块,锁相环频率综合器电路直接决定了整个
行人导航是导航领域中一个重要分支,在行人定位信息服务中发挥着重要作用,极大地提高了人们的工作和生活效率,在军事和民用领域都展现出了广阔的应用前景。本文对基于微惯性测量单元(Micro Inertial Measurement Unit,MIMU)的行人导航中的关键技术进行了研究,主要研究内容如下:(1)针对微惯性器件的对准问题,研究了基于磁力计辅助的初始对准算法。采用基于最小二乘拟合的磁力计校准算
学者检索和学者社区发现系统是产学研服务系统中的检索工具,为产学研服务提供数据支持服务和信息检索功能。高校中的学者承担科研项目,将其中高价值科技成果应用于生产,可以促进产业升级,提升竞争力。但在实际产学研合作过程中,存在学术与技术脱节,成果转化率低下等问题。现有检索系统侧重于学术检索,检索对象单一且功能简单,难以应用在实际产学研项目。因此,构建一个能快速准确地检索到合作对象,并对其能力进行评估的系统