新一代则序技术中的短序列比对和组装算法

被引量 : 2次 | 上传用户:steven146
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新一代测序技术产生的序列片段普遍在35bp~75bp且数据量巨大,原来的序列比对和组装软件不适合这么短的序列,这就给序列比对和序列组装提出了新的挑战。本文主要探讨了新一代测序技术中的短序列比对和短序列组装算法。主要工作如下:(1)深入分析了基于哈希表的短序列比对算法ELAND、MAQ、SOAP以及基于BWT的短序列比对算法BOWTIE、BWA、SOAP2,对它们的原理及具体实现步骤进行了详细的解释,最后从模拟数据和实验数据两个方面对它们的性能进行了比较,从实验结果看基于BWT的算法在时间上与空间上一般优于基于哈希表的算法,MAQ算法虽然运行时间比基于BWT的时间要长,但是其内存使用率较低,SOAP算法是所有算法中对内存要求最高的算法。(2)对短序列组装算法进行了分类归纳,对SSAKE、VCAKE、VELVET短序列组装算法的原理和实现也做了深入的分析,并使用乳酸菌基因组对它们的性能进行了比较。从实验结果看,VELVET算法的拼接性能最好,其次是VCAKE,而SSAKE运行的时间较长。(3)然后提出一种新的基于分块索引的比对算法,算法也是基于BWT,它采用对BWT分块索引压缩的方式,并在内存中建立缓冲区,按照最久不用的原则将最久不用的块调出,以减少内存的占用。从实验结果看,当算法的缓冲区越大的时候,执行速度越快,优与MAQ算法,当缓冲区越小的时候,执行时间较长,但内存使用明显低于BOWTIE等算法。(4)最后对SOAP比对算法提出了一些改进,将短序列分为A,B,C三段,使内存使用率降低,加快了比对速度。并通过实验与SOAP算法做了比较,其内存使用率和运行速度均优于SOAP算法。
其他文献
<正> 近年来,学生学习行为的自我控制与调节(以下简称自我监控学习)问题日益受到研究者的高度重视,成为国际认知心理学、学习心理学和教育心理学研究领域的一个新课题。大量
自1978年改革开放以来,经过30多年的发展,我国经济突飞猛进,目前已超过日本成为世界第二大经济体。在市场这块蛋糕做大做强的同时,如何做好分配工作成为党中央及社会各界关注
城市土壤是保护城市环境的一个重要生态屏障,城市土壤的退化过程实质上是其"自我牺牲"地发挥生态服务功能从而导致自身质量下降的过程,因此其自身常常存在各种各样的环境问题
目的:本研究拟自主设计研制操作性强、精确度高的数字化女性盆底生物力学在体拉伸测量系统,并建立实用可行的女性盆底支持结构在体生物力学性能的测量方法;进行盆底重建手术所
为了解不同土地利用方式对土壤剖面CO2体积分数的影响,采用气相色谱法对贵州喀斯特地区土壤不同深度空气CO2体积分数进行观测。结果表明:不同土地利用对土壤平均CO2体积分数
如果将裁判文书看作是司法运行的终端产品,裁判文书说理则构成其精华和灵魂,恰恰是法官的“工匠精神”之所在,是司法改革成果在个案中的总体现。然而司法实践中,裁判文书说理还存
报纸
本文利用灰色关联度的理论,对我国制造业上市公司的资产结构与企业业绩的关系进行实证分析,最后得出资产负债率、权益乘数、流动资产比率、有形资产比率、流动负债比率、固定
烟嘧磺隆是很好的玉米苗后广谱除草剂,有很好的发展前景。然而,作为一种高效的除草剂,还没有人系统的研究过它在环境中的转化和迁移,因此研究其在环境中的降解特性是很有必要
BT融资模式是从BOT模式转化发展起来的新型投资模式。随着国家对基础设施领域国有资金投入的减少,以及市场竞争机制的不断完善,使得其他资金有更多的机会投向基础设施建设领
我国的环境保护工作虽已经历了从末端污染治理到全程管理的转变,对遏制环境污染发挥了一定作用,但作为经济制约型的环境战略,它具有很大的被动性和局限性。面对新时期的环境