论文部分内容阅读
在生物信息学领域,利用计算对蛋白质折叠进行模拟运算并从中预测出蛋白质分子空间构象的方法已被普遍接受,然而模拟运算所需要的计算量异常巨大。为了应对计算能力不足的问题,人们提出了多种分布式计算平台对蛋白质折叠模拟运算进行研究。虽然这些平台在一定程度上缓解了计算资源匮乏的状况,但通常存在单一节点失效和任务划分不灵活等缺点。因此,设计和实现的P2HP(P2P-based high performance computing platform)平台克服上述缺点,使分布式计算具有了更好的灵活性、容错性和扩展性。对于P2HP计算平台而言,高效的任务管理机制是必不可少的。为了达到该目标,P2HP平台以文件的形式对计算任务进行了组织,使得任务的存储、任务的传输以及任务的操作机制都有其优势:运用存储任务元数据和嵌入式数据库的策略,提高了任务的存取效率;定义基于连接的数据管道传输协议,对任务的传输进行了快速处理;提供了一整套软件开发包,方便了用户和志愿机对任务进行操作。通过对基于格点模型的PERM(Pruned-Enriched-Rosenbluth Method)算法进行分析,设计了PERM算法的分布式计算的策略,并对该策略在几类分布式计算平台上的实施进行了探讨,且最终将基于PERM算法的蛋白质折叠分布式计算运行于P2HP平台之上。将目前运行效率较高的PERM算法运行至P2HP平台上,能够充分地说明平台的通用性和可用性,为解决蛋白质折叠计算问题提供了一条新的途径。实验结果表明利用P2HP平台对基于PERM算法的蛋白质折叠计算进行分布式处理,不但能够增加算法在单位时间内搜索结果空间的次数,而且随着志愿机数目的增加,P2HP平台的加速比会有所提高,使得平台能够在较短的时间内找到蛋白质分子的最优空间构象。