论文部分内容阅读
计算机学科的一大特点是软硬件相互促进发展,计算能力的需求刺激着硬件设备的更新换代,新的计算设备为更加复杂的算法实现提供可能。近些年来,这种特点在高性能计算领域体现的尤为明显。在计算成本一定的前提下,通过现有异构众核架构来充分挖掘计算潜力,是一种可行的解决方案,具有性价比高、利用率高的特点。其中,Nvidia GPU和Intel Xeon Phi是混合架构下两款最为流行的通用高性能计算设备。在金融工程领域,通过分析固有的经济运行规律,借助强大的数学工具,多种有效的计算模型被设计出来。金融问题的求解最直接的价值就是能带来巨大的经济收益,但此类问题的求解往往带有强烈的时效性,以对时间敏感的中高频金融交易为例,经济收益往往出现在毫秒级的时间窗口中,所以计算速度在其中显得尤为重要。此外,当新的金融算法提出之后,如何在瞬息万变的市场中根据实际情况进行修正与验证,也严重依赖高性能计算。因此,将高性能计算逐渐引入金融工程领域成为了一种必然。借助高性能计算设备,快速、准确、高效地求解复杂的金融问题是如今尤为重要的一种途径,相关领域的问题也成为了金融与计算机交叉领域的研究热点。本文充分利用异构众核架构计算性能高、计算边际成本低的优势,选取BSDE-二叉树欧式期权定价算法进行加速,基于有限的计算资源和良好的扩展性原则,对此类问题进行求解。其中,涉及的计算设备包括多核CPU、Nvidia GPU以及Intel Xeon Phi。为了充分利用现有设备的计算能力,实现良好的扩展性,我们设计了一种混合计算模型,包括任务层并行化和设备层并行化两个层次,使得计算设备能够根据自己的计算能力主动索取合适大小的计算任务,实现负载均衡的同时减少数据传输所带来的额外耗时。同时,基于已经提出的BSDE-二叉树欧式期权定价算法,我们通过增加并行粒度来进一步挖掘计算潜能,对原有的运算进行优化,降低了逻辑运算次数,针对新的架构体系进行进一步适配,提高算法的执行效率。最终实现了在大量期权计算任务场景中,多种异构的高性能计算设备组成的集群相互独立地执行各自的期权计算任务。框架在扩展性和加速比两方面都取得了很好的效果。在未来的工作中,我们将在现有研究的基础上,进一步提高框架的通用性,将更多的金融工程算法整合到框架中,为衡量金融风险、获取金融收益以及有效验证金融工程算法表现提供一个快速实现途径。并且进一步提高算法框架的通用性,透明计算设备,降低框架用户的编程成本。