论文部分内容阅读
本文提出基于星型模型扁平化编码方法的百分点聚集函数的并行算法。首先把星型模型中维表上和查询相关的维度层次信息编码到事实表里,该编码方法使得经过改写的聚集查询,在查询处理过程中无需进行事实表和维表之间的连接,于是数据可以均匀分布到机群上,利用并行处理提高查询性能。百分点计算不具有天然的并行性,本文提出基于采样预测的并行迭代式算法,通过付出采样数据的网络传输开销,使得算法快速收敛,解决大规模机群上的百分点聚集函数计算的性能问题。实验结果证实,该算法不仅快速收敛,同时其网络传输开销也是可以接受的。