【摘 要】
:
通过序列数据重建基因组,或者进行单倍体组装,面临着巨大的挑战。复杂的真核生物,特别是人类基因的数量巨大,而且样本增长迅速,所以人们不得不采用高通量测序技术进行基因测
论文部分内容阅读
通过序列数据重建基因组,或者进行单倍体组装,面临着巨大的挑战。复杂的真核生物,特别是人类基因的数量巨大,而且样本增长迅速,所以人们不得不采用高通量测序技术进行基因测序工作,并通过先进的计算机技术来提高其精确度和计算效率。基因测序能够获取染色体中包含单核苷酸多态位点的一段连续的DNA片段,通过将读取的DNA序列映射到参考序列上,便可以知道该片段所属的染色体源点。当读取的片段包含两个或者更多的单核苷酸多态时,就能够提供有用的相位信息。单倍体组装的任务就是对于给定的一些染色体上读取的片段变异信息,计算每条染色体的单体型序列。本文研究了单倍体组装的图模型理论,提出一种基于冲突圈消融的算法(Resolving Conflict Graph Algorithm),该算法通过片段与SNP位点的关系生成一个有权无向图,即包含SNP冲突圈的图模型。该图中的节点是由单核苷酸多态(single nucleotide polymorphism, SNP)位点组成,边为支持两个SNP位点的片段,边的权重为支持SNP位点的染色体片段值的总和。本文所研究的算法能够判断出图中因测序错误而形成的冲突圈,通过消融冲突圈,达到修正位点的目的,最终输出单倍体序列。通过与其他三种模型下的算法进行比较,我们的算法在降低片段错误率上具有一定优势。
其他文献
通过对塔子坪滑坡地质条件与力学参数进行调查和分析,利用有限体积法,在充分考虑滑坡-碎屑流运动过程中流态化性质的基础上引入流变模型,借助于GIS平台对塔子坪滑坡治理前后
<正>根据审计署联合国审计委员办公室对联合国各机构审计工作的安排,我自2009年初至今先后参加了联合国儿童基金会驻尼日尔、塞内加尔、斯里兰卡、埃及四个区域办事处和纽约
该文作者对木种质资源进行了大量调查工作,广泛搜集了木瓜野生及栽培资源、经过多年栽培与观察,研究探讨了木瓜栽培历史及现状、分布与生和种质资源分类问题,将现有资源分为三大
奶牛乳房炎是制约乳业发展的重要因素之一。一般而言,7~9月份气温高,奶牛隐性乳房炎的发病率处于高峰期,而冬季较低。环境卫生好,环境病原菌的种类和数量相对较少,隐性乳腺炎
电力信息网络是电力CPS的有机组成部分,电力信息网络的脆弱性威胁评估是电力CPS风险评估的重要基础之一。针对通用信息网络脆弱性威胁评估技术的局限性,在通用弱点评价体系(C
老兵退伍是部队一年一度的经常性工作,时间性强,牵涉面广,工作量大。从思想工作的目的来看,主要是达到个人服从组织,做到“走者愉快,留者安心”;从思想工作的过程来看,有调查摸底阶段
崩漏是妇科较常见疾病,吾师张晓丹通过多年的丰富临床实践与研究,形成了独特的中西医结合治疗崩漏的临床经验,在治疗上灵活运用“塞流、澄源、复旧”三法,但不拘泥于常理,出
国产“飞跃”牌小白鞋,估计40岁以上的人都记忆犹新。在上个世纪的中国,“飞跃牌”跑鞋曾经风靡一时。但这个在中国只卖20多元的小白鞋,经几个法国人一倒腾,价格飙升了20倍,
文章从着眼于培养中学生物教育和教育创业所需的应用型人才出发,研究所建构的高师中学生物教育课程群关注四大教学理念的转变,以"中学生物教育和活动指导"为学习领域,构建"关
目的:研制新一代的人工半骨盆并临床应用。方法:应用计算机三维重建、个体化设计及数控制造技术研制新一代的人工半骨盆,应用椎弓根螺钉固定假体,将新型人工半骨盆置换入人体。结