论文部分内容阅读
如今,大规模系统如数据中心中日益增多的应用负载如搜索引擎、推荐系统等越来越表现出以数据为中心、有限的局部性等特征,而传统的计算机系统以计算为中心、多级存储的架构,需要将数据从存储介质经过一级级存储层次传递到中心CPU才能完成任务处理,这样就会带来大量没必要的数据搬运开销,从而产生巨大的功耗与成本。 利用存储介质(如内存、磁盘等)内置的计算能力,综合数据存储位置与从数据中需要提取的信息等,在最合适的位置完成任务处理,即近数据处理,可以节省大量的数据搬运开销、节约I/O功耗,同时带来高带宽、低延迟及探索应用负载大量内在并行等好处。因此,在大规模系统功耗成本越来越突出的背景下,近数据处理相比传统的以中心CPU为计算中心的计算机架构更适用于在大规模系统中日益增多的以数据为中心的负载特性,从而也越来越受到研究者关注。 同时,SSD在数据中心等大规模系统中的大量布置,及其拥有更高的内部带宽、可观的计算能力等特点,使得SSD成为实现近数据处理的理想存储介质。 本文基于OpenSSD开源开发平台,设计并实现了一种基于SSD的近数据处理原型系统,验证原型的正确性,并论证了基于SSD的近数据处理的可行性。