论文部分内容阅读
本文利用cuDA执行模型实现了植物模拟生长算法的完全并行化,结合标准排源质量评价数学模型,得到了一种高效率的并行排源算法,对应的代码能运行在GPU上。在此基础上,利用若干不同规模的排源算例对新版本算法进行了测试。测试结果表明,在保持已有版本算法优点的基础上,新算法的计算效率相对cPu版本提升了5。0倍以上,相对cPu+GPu混合版本,也提升了30倍以上。对111PBq以下装置,新算法的计算时间小于10min。利用单GTx275GPu,新算法的计算性能上限为167PBq左右,时间不超过25min,利用多GP