论文部分内容阅读
本文介绍了定量蛋白质组学中一个较为年轻和重要的新课题:基于质谱的非标记定量。基于质谱的非标记定量技术不使用同位素标记等化学手段,而是通过对质谱原始数据的分析和处理来进行蛋白质定量。
本文对基于质谱的非标记定量技术做了概要性的调研,阐述了此技术中存在的大规模数据处理性能瓶颈问题,并进一步指出了高性能计算尤其是并行计算技术在非标记定量中应用的迫切性和必要性。
针对当前质谱数据可视化辅助分析工具共同存在的一个缺陷,即质谱数据需要全部导入内存,本文设计并实现了质谱可视化辅助分析工具MZ-Analyzer。与其它可视化分析工具不一样的是,MZ-Analyzer没有将质谱数据全部导入主存,而是通过构建外存索引提高质谱数据可视化辅助分析的性能。因此,尽管随着质谱数据量的指数性增长,MZ-Analyzer的性能仍然具有良好的可扩展性。
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行QuantWiz。通过实验验证并行QuantWiz具有良好的并行效率,当进程数为32时,并行效率为63%。