论文部分内容阅读
石油资源不仅影响一个国家的经济发展,更是一个国家不可或缺的战略资源。预测石油储产量峰值及其出现时间,能够为石油战略决策提供极有价值的预警信息。开展机器学习理论方法在石油峰值预测中的应用研究,可以更好地增强模型描述能力并提升预.测的合理性。本文介绍了相关的石油峰值模型和机器学习方法。首先研究和实践了基于模型删除数据的异常点检测及其处理方法,进而依据检测后的数据基于逐步向前回归的思想建立了适用于中国石油产量预测的Hubbert模型;然后在大量国内外石油峰值预测模型调研的基础上,结合不同的机器学习算法,研究了多种石油峰值预测的建模方法,尤其提出了可描述多循环产量趋势特征的多峰预测模型。本文的主要研究内容如下:(1)设计了基于模型删除数据的异常点检测算法,并利用该算法对中国石油产量数据序列进行了异常点检测。(2)利用逐步回归建立符合中国石油产量趋势的Hubbert模型。按容忍处理和修正处理的两种异常点处理情况,基于逐步回归得到不同URR(最终可采储量)值,从中选取几个较有代表性的URR值进行模型的建立和预测对比,得到异常点修正后URR为132.72亿吨时建立的Hubbert模型更适用于中国石油产量预测的结论。(3)提出了基于单峰模型的分段预测模型、基于分段线性拟合的多峰预测模型、基于多项式拟合的多峰预测模型、基于动态规划的多峰预测模型4种多峰预测模型的建模方法,并提出了基于波谷识别、基于多项式拟合和基于动态规划策略3种自动检测峰期和数据分段的方法。最后,利用国内某油田某开发区产量数据对四种多峰预测模型进行了实例研究,发现在方法复杂程度、峰期分段识别、趋势特征适应等方面,不同模型有各自不同的优势和不足:单纯的多项式曲线拟合对未来数据的预测偏离实际,对于石油产量这样数据波动较大且数据量不多的数据集适用性较差;基于动态规划的多峰预测模型对于模型的求解建立方法最简单,但是其峰期识别方法不如基于波谷特征识别峰期的方法精确;基于单峰预测模型的分段预测模型比较适用于整体增长趋势比较平稳的多峰产量数据;基于分段线性拟合的多峰Hubber预测模型比较适合整体呈现上升趋势的多峰产量数据。