论文部分内容阅读
序列比对是生物信息学的基础,通过多条序列比对可以挖掘出生物序列中的各种重要信息。大规模的基因序列比对方法对运算能力要求较高,基于Map Reduce框架的多序列比对方法在多序列星比对算法的基础上利用分布式并行计算来处理大规模数据。实验结果表明:相对于单机处理方法,基于Map Reduce的序列比对方法可以更快速地处理大规模数据,并且具有良好的硬件扩展性。本文探讨了多序列比对在肿瘤研究方面的应用前景。