PacBio测序模拟系统PaSS

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:dustfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:近几年,三代测序技术如PacBio测序技术正在迅速发展。PacBio测序技术比二代测序技术产生更长的序列读长,并且有其独特的测序错误特征。针对PacBio测序技术开发的生物信息学工具和算法也随之涌现,如比对软件、序列拼接软件、结构变异分析软件等。模拟测序数据可以帮助研究者评估同一用途的不同软件和流程,为程序选择特定的参数等,是性价比高且节省时间的方法。此外,PacBio测序平台发展迅速,已有了多代测序仪,因此可以有效模拟不同代测序仪的测序数据特征的测序模拟系统对于评估和促进基于PacBio测序数据分析的新生物信息学工具的开发至关重要。结果:我们开发了一个针对PacBio测序平台的测序模拟系统PaSS。它能从真实的PacBio测序数据中估计出序列模式和错误模型。PaSS的模型中除了multi-pass的特征及序列长度分布信息,我们还包含了与序列上下文有关的测序错误模型,并用一个预设的高错误率来模拟那些因错误率高而比对不上参考基因组的序列区域。我们将PaSS与现有的PacBio平台的测序模拟工具如PBSIM、LongISLND和NPBSS进行了全面的比较和评估,并采用了K-S检验对结果进行评估,结果表明PaSS在多个方面都表现更好。最后,我们还采用了间接比较的方法,从序列拼接的角度也表明PaSS模拟的序列与真实测序数据最接近。结论:PaSS是一个快速有效的PacBio测序模拟工具,它将有助于PacBio测序数据的生物信息分析工具的评估和开发,可以加速PacBio测序的应用发展。
其他文献
自新世纪以来,电视剧作为大众艺术,被广大人民所喜爱,有了庞大的群体需求。电视剧的兴起不仅娱乐了人们的生活,更是给人们的思维方式和价值观念带来了潜移默化的影响。其中家
通过盆栽试验研究了不同氮素形态对烤烟根系生长发育的影响,结果表明:NO-3-N和NH+4-N等量配施可促进烤烟根系前期的生长发育;20%腐熟饼肥中的氮+40%硝态氮+40%铵态氮处理对根
2000-2001年,在河南农业大学实验站进行了不同覆种材料对烤烟漂浮育苗中烟苗生长发育和生理特性影响的研究.结果表明,烤烟漂浮育苗采用蛭石覆种效果好于基质覆种.蛭石覆种可