基于分段pHMM的长读混合纠错算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:bbswile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第二代DNA测序技术虽然通量高,并保持了高精确度,但是由于序列长度较短,当参考基因序列较长时,无法跨越重复区域,从而使下游分析受到挑战。第三代DNA测序技术能够产生更长的序列,虽然能够弥补二代测序产生的不足,但缺点是测序序列的错误碱基个数也会增加,因此,正确率大约只有85%。在这样的情况下,研究者们将短读(SRs)序列和长读(LRs)序列优势互补,使用精确度较高的短读序列对错误率较高的长读序列进行纠错,在尽可能不损失序列长度的基础上提高序列的精确度。虽然一条LR序列的错误率大约在15%,但是相比于整条LR序列,正确的碱基仍然占较大比重,如果对整条LR序列进行复杂的纠错计算,不仅会消耗运行时间,还会造成过量的内存占用。因此,在Hercules算法的基础上,本论文提出了一种基于分段的隐马尔可夫模型(p HMM)的混合纠错方案,对于长读中匹配较好的部分不做处理,未被覆盖的部分或者匹配效果不好的部分进行p HMM纠错,在保持较高精确度的同时优化运行时间。纠错部分主要分两步,基于短读对齐的预处理和基于p HMM的纠错。本论文的优势是在Hercules的基础上将隐马尔可夫模型和对齐器相结合,采用分段的思想对序列进行纠错处理,在一定程度上既减小了对对齐器性能的依赖,同时,也减少了使用隐马尔可夫模型进行全局纠错的运行时间。为了评估本方法,我们将其应用于两个实验数据集,大肠杆菌数据集和酿酒酵母数据集,并且我们将实验结果和未压缩的Hercules纠错阶段进行对比,发现在保持精确度的同时,大肠杆菌的运行时间降低了65%,酿酒酵母的运行时间降低了4.7倍。
其他文献
报纸
图像融合就是利用当下最先进的数学方法,把不同设备对同一场景采集到的图像信息输入到计算机中进行计算,得到的融合图像就包含了全部场景信息。该技术可以为实验人员提供准确、全面的场景信息。本文从实际需求出发,根据红外和可见光图像和医学图像的特征,对其融合算法进行研究。在诸多融合方法中,非负矩阵分解(Non-negative Matrix Factorization,NMF)因其非负性、稀疏性、维数约减和良
学位
<正> 聚碳酸酯塑料是近几年发展较为迅速的一种工程塑料。它具有很多优良的性能,因而被广泛应用于机械、建筑、交通运输、航空、电气电子工业等部门。我国聚碳酸酯塑料通过几年会战,质量和产量都有很大提高。为了对国产聚碳酸酯的性能有一个比较全面的了解,我们根据“74年光气法聚碳酸酯生产技术座谈会”的要求,对杭州塑化一厂、天津五·七化工厂和日本C—1400的聚碳酸酯试条进行了一些常规老化试验对比。现将试验情况
期刊
报纸
随着数字图像和通讯技术的快速发展,图像数据在各行业中得到了越来越广泛的应用,然而因为一些客观因素的存在,图像在经历过数字图像处理系统后会丢失部分图像信息,最终致使图像品质下降,然而这可能会影响到后续的图像处理工作,甚至对图像的内容理解发生偏移,因此把握图像质量的变化水平是件非常有意义的事情。而IQA作为计算图像质量退化水平的方法,在近十年被提出并得到了广泛的应用。本文在研究了相关算法后,分别提出了
学位
随着我国民用航空事业的不断发展与进步,民用航空业在交通运输行业占据着越来越重要的角色,已经成为了重要的战略支柱产业。在民用航空领域,安全问题总是进行各项工作的核心与保障。实时的对监测范围内的航班进行监测是保证民用航空安全运行的必要前提,实时的对航空数据进行分析与处理是保障民用航空安全运行的关键。本文利用ADS-B、软件无线电技术、数据可视化和互联网等技术将民用航空监视和航空频段无线电监测结合起来,
学位
农业在我国国民经济中具有突出重要的地位,也是基础。农业发展是否稳定牢固,这不仅仅关系到人们的生活日常,同样关系到国民经济的命脉。在中国经济高质量发展过程中,涉农企业在农业发展进程中贡献着自己力量,但县域内中小型涉农企业的发展存在问题,这不仅不利于企业发展,而且影响我国农业高质量发展。与此同时,涉农企业在我国农业产业化绿色可持续发展过程中,特别是在壮大特色产业,增加农民收入,助力乡村振兴起到了促进作
学位
在气体绝缘金属封闭开关设备(GIS)中,绝缘隔板起着隔离相邻气室、支撑导体的重要作用。绝缘隔板的机械强度是保证GIS安全可靠运行的基础。详细介绍了新型145 kV绝缘隔板的设计特点;应用有限元分析计算软件对其力学性能进行了数值仿真,计算结果表明,特定形状的中心嵌件可以有效提高其力学性能。该新型145 kV绝缘隔板在质量监督检验中心顺利通过了整套型式试验,进一步验证了其力学性能的可靠性。
期刊
报纸
袋式除尘滤料作为主要的工业烟气粉尘颗粒物处理元件,在滤料纤维、结构、应用等方面趋于成熟。文章介绍了当前袋式除尘滤料的发展情况,包括颗粒物治理现状、不同滤料纤维选型、滤料及滤袋的结构设计、功能性滤料的开发及应用情况等,并对功能性滤料、废旧滤料的资源化处理提出一些建议。
期刊