基于个体和群体DNA数据的单体型频率估计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yulinfeng93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因研究中一个重要的课题是从基因型数据中推断出单体型对的形式,这就涉及了估计单体型的频率。本文针对个体型和群体型DNA数据给出了一个统一的算法CSPool对单体型的频率进行估计。特别地,对个体型数据而言,针对每个个体的基因型CSPool可以推断其一对单体型的相形。相较以往的方法而言,本文使用的方法有较大的速度优势,并在相同数据集和数据类型中与多种方法有可比的准确性,拥有较小的偏差和同其他方法可比的解的稳定性。此外,本文率先在单体型频率估计中引入压缩感知作为工具,对稀疏性先验进行充分利用,从而达到快速且准确的对单体型频率进行估计并推断基因的相形;本文亦提出了处理位点较多时所用的与压缩感知相应的分割捆绑算法及参数选择,从而可以估计位点比较多的单体型。亦实现了CSPool的图形界面和网页应用软件。在不同类型的数据集上,本文使用了CSPool与一些现有方法进行了比较,发现CSPool具有一定的优越性。基于此,可以预见,本文提出的方法CSPool在现在下一代测序技术大发展的背景下有很大的使用空间。
其他文献
目的 通过对血液透析血管通路相关并发症的ICD-10编码质量分析,为医疗管理部门提高编码准确性提供依据。方法 利用病案信息系统检索出某院2019年1月1日-2020年12月31日肾病内科病案首页信息,筛选诊断中含有血管通路并发症的病案,根据ICD-10规则对编码的准确性进行评价。结果 血管通路并发症病案537份,编码错误病案256份,错误率为47.67%,导管相关感染编码错误率最高,为93.83%
在双减背景之下,减轻小学生数学作业负担,一方面是减轻学生生理层面的负担,另一方面是减轻学生心理方面的负担,具有多重意义。老师在布置数学作业时,要充分认识到数学作业是对数学课程教学的补充,巩固和强化课堂所学的知识。尤其是在小学数学工作中,老师要贯彻落实高质量分层设计的作业布置方式,帮助学生提升做作业的兴趣。本文基于双减背景思考数学作业高质量分层设计存在的问题以及相应的应对方法。
本文主要以田刚的著作文献[9]来对紧致K(a|¨)hler流形上关于K(a|¨)hler-Einstein度量存在性和唯一性方面做一个简单扼要的读书报告,本文的主体由四大部分组成。在第一部分中,介绍复流形的基本知识,包含K(a|¨)hler流形和K(a|¨)hler度量以及曲率,最后证明K)a|¨)hler流形上的单值化定理.在第二部分中,引进Extremal-K(a|¨)hler度量,简要回顾陈
学位
电子与固体中的相互作用构成了许多材料分析工具(扫描电子显微学、表面电子能谱学、电子探针微分析等)的物理基础(第一章)。根据固体/表面中的电子散射理论和Monte Carlo模拟方法,基于实体结构几何法构造模型,我们研究了梯形线几何体在扫描电子显微镜的主要信号成像、测量线宽的性质(第二章)。基于有限元三角形网络法模型构造(第一章),我们研究了粗糙表面的电子能谱、二次电子产额和背散射电子产额(第三章)
南海是中国最大的边缘海,地处热带与亚热带,且沿岸江河密布,珠江,湄公河等河流将陆源营养物质不断向南海输入,因其面积之广,深度之大,陆源营养盐的输入远远不能满足浮游植物大面积暴发的需要,所以南海是一个相对营养贫乏,生产力较低的海域,南海复杂的地理气候环境对浮游植物的生长影响显著。浮游植物群落是南海调查的重要指标之一,对了解南海生产力,水团海流具有重要作用。颗石藻因其显著的有机碳无机碳生产效应,对全球
今生颗石藻(living coccolithophores或living coccolithophorid)是一类在全球海洋中广泛分布的海洋微型浮游植物,它们在海洋浮游植物功能群落中是一类极其重要的钙化生物类群,也是海洋中生源无机碳的重要来源,并且在海洋的碳循环过程中起到重要的作用。今生颗石藻由于快速增殖而发生水华的过程中能够释放大量的具有挥发性的二甲基硫(DMS)和丙烯酸(acrylic aci
火星是一个沙漠化的行星,拥有稀薄的大气层。自从1971年水手9号飞船进入绕火星飞行轨道后,就有很多关于火星沙尘暴的观测资料传回地球。火星上存在有利于沙尘暴形成的条件,不过由于火星的大气密度非常低,火星沙尘暴的起动风速要比地球上大许多。海盗1号和海盗2号着陆器在火星表面工作数年,测得火星沙尘暴的起动一般需要离火星表面2m高处的风速达到30m/s,这相当于地球上的12级飓风。本文通过建立地表风-沙物理
本文首先对蛋白剪接作用及蛋白内含子(intein)做了文献调研。分别介绍了蛋白剪接(splicing)作用及蛋白剪接反应机理、蛋白内含子的命名、分布、保守基序、结构域、种类、生物学功能和应用几个方面。分析了近些年来关于蛋白内含子研究的状况和进展,为课题的开展做了基础铺垫,指导了后续实验。文章着重于蛋白剪接抑制剂的筛选和作用机理的研究,分别用体内和体外报告体系对几种的蛋白剪接抑制剂进行了活性测试。顺
目的探讨家属参与式延续性护理在冠心病PCI术后患者中的应用效果。方法选取新汶矿业集团莱芜中心医院2018年9月—2019年9月收治的126例经PCI术治疗的冠心病患者作为研究对象,按随机数字表法分为观察组和对照组,每组63例。对照组接受常规心内科护理,观察组在对照组基础上接受家属参与式延续性护理。护理前后,检测并比较两组B型利钠肽(BNP)、左心室射血分数(LVEF)、左心室舒张末期容积(LVED