论文部分内容阅读
生物医学正逐步走向大数据时代,新一代测序技术的发展正在逐渐改变诸多生物领域的研究方法。微生物检测旨在检测出宏基因组样品中的病原微生物。“未知”的生物威胁由于其突发性、场地设备技术受限等特征,难以得到快速、有效的应对,是生物医药领域的一个棘手问题。基于新一代测序技术的微生物检测方法由于确证率高、周期短,成为面向“未知”生物威胁预防的重要手段。如果能够在短时间内准确地检测出宏基因组样本中的微生物,确定其种源、毒力等信息,则对疾病防控、药品研发都有很大的帮助,是目前生物医学研究的一个热门话题。本文首先对近期发表的生物医学数据分析中的基于新一代测序数据的微生物检测计算模型进行了研究,随后针对基于新一代测序数据的微生物检测方法难以综合评价的问题,提出了微生物检测计算分析Benchmark(Computational Analysis of Microbiome Identification,CAMI Benchmark),利用github项目可以实现对计算方法的自动化分析评价。之后提出了基于提前设定检测敏感度预值的可调式微生物检测算法AMDA,并利用CAMI benchmark对其进行了性能评测,评测证明在original模式下,ADMA能够将敏感度误差控制在3%以内,并实现与Readscan类似的检测速度。最后针对移动测序的背景,提出了基于FPGA和高性能计算平台两种方案的移动微生物检测计算平台MDPMS。实验证明对于测序仪HiSeq2500实测产生的120Gb数据,未经过优化的检测流程处理时间超过四个月,经过优化后的基于FPGA的运算平台运行时间缩减为一周,基于高性能计算平台的运算时间缩减为2天。