实用的细菌基因组组装策略:混合组装

被引量 : 0次 | 上传用户:pangdunpiwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:确定微生物的基因组序列是研究他们的生物学和功能特征的基础和先决条件,而得到完整的基因组序列是首要任务。目前,Illumina平台测序技术已经发展得很成熟,read的测序长度从最初的SE36bp(GA)增加到现在的PE300bp(Miseq),借此已完成大量的基因组组装工作,但通常也只能得到基因组草图,而对于高重复,高杂合,以及复杂区域,其组装结果往往差强人意。Pac Bio技术的出现,借助其长read的特点,在一定程度上,可以弥补Illumina短read在组装上的部分缺陷,但其成本的昂贵且通量低,限制了其大规模的应用。结果:本论文使用Illumina平台和Pac Bio平台对S.enterica、S.aureus和B.parapertussis三个细菌进行了全基因组测序,分别获得150X以上的Illumina数据和50X以上的Pac Bio数据。分别使用Illumina数据、Pac Bio数据和不同乘数两种数据混合对三个基因组进行组装,结果说明两种数据混合组装的策略是可行的,且在50X的Illumina数据加上20X的Pac Bio数据的组合下就可以获得较好的组装结果,三个细菌的组装结果Contig数量都为1,N50长度分别为~4.85M、~2.91M和~4.18M,覆盖度都达到0.99以上,相似度达到0.95以上。结论:两种数据混合组装的策略是充分利用Illumina数据的高准确性和Pac Bio数据长read的优势,降低高重复、高杂合等复杂区域的组装难度,使组装的结果达到完成图的水平,这种策略既满足组装结果准确性、完整性和连续性的要求,同时最大程度地降低测序成本。
其他文献
1原料市场进入2019年7月上旬以后,国内棉短绒价格依然表现的十分平稳,市场没有出现大的波动,短纤级棉短绒南方以及山东等地区自提成交价格依然稳定在了3100元/吨;而长丝级棉
本系统基于STC89C51单片机、温度传感器及三路继电器组成的中药熬制自动换火系统。该系统可以根据设定的温度和熬制需要的时间用继电器来实现中药熬制自动换火功能。该系统在
摘要:“读书百遍,其义自见。”阅读是语文教学中最基本、最重要的训练。作为一种艺术性和工具性结合的科目,课内阅读不可或缺,但真正源泉来自于课外。课外阅读是课内阅读的继续与
报纸
新型农村医疗合作制度(NRCMS)是由政府组织、引导、支持,农民自愿参加,个人、集体和政府多方面筹资,以大病统筹为主的农民医疗互助共济制度。作为农村社会保障体系的重要组成
高校教学在素质教育的不断深入下,对体育教学的重视程度越来越高,排球教学作为高校体育教学中的重要组成部分,对提升学生身心健康,促进学生的全面发展发挥着重要作用。但高校
小组合作学习是“以异质小组为基本形式,以小组成员合作性活动为主体,以小组目标达成为标准,以小组成绩奖励为依据的教学策略体系”。小组合作学习之所以能够广泛存在,主要是
邓小平关于和平与发展是当代世界主题的论断,是对列宁“战争与革命”时代主题观在战后新形势下的创新和发展.它使社会主义国家能够把工作重心转移到经济建设上来。“冷战”结束
利用小麦条锈病发生程度与气象条件的关系,预测其流行趋势,可以为当地麦区适期开展综合防治、控制其流行为害提供科学依据。通过对陕西省小麦条锈病历年发生程度与上年11月至
2004年,德国强制实施统一按照病种分类偿付与计价系统、节约医疗支出、增加投保人的医保附加费等等。这次法定医疗保险制度改革是德国统一以来幅度最大的一次社会福利改革。而
报纸
在化学实验开展过程中,相关工作人员必须要做好细节性检测工作,从而推进化学实验的有序开展。具体来说,化学检测工作开展期间,需要科学选择检测方法,保障检测工作的准确性。