论文部分内容阅读
随着大数据时代的到来,数据挖掘的知识越来越广泛地应用于我们的生活之中,也同样给予油田信息化的转变提供了新思路。本文以聚类分析和回归技术为基础,结合大港油田与油井工作状态相关的参数,对油井参数进行预测,并对油井按照工作状态进行分类并进行分析,以期实现油井的预警与区块分类管理,同时提出一些管理意见,对油井效率和生产能力有很积极的影响。具体完成的工作如下:第一,针对油田实际难管理、工作效率不高的现状,创新性的提出依据与效率或产量相关的一些参数用聚类方法对油井进行分类,从而便于油井分类管理,对于效率不高的井堆进行参数调整。对于不同井数量和工作状态相似性的特点,选择三种不同的聚类算法:K-means、DBSCAN以及层次聚类法分别对多井、临井、相似井进行分析。同时还提出一种基于投票和距离聚类的Voting-K-means方法,在兼顾计算速度的同时也采用多次计算综合结果的方法提高了准确率,得到一个更具泛化意义的算法。第二,由于选择的效率以及产量相关的参数数量多且参数之间有一定的共线信息重叠性,信息有一定的冗余性的问题,会造成计算过程的难度增加而且还会造成计算成本增高。针对上述问题提出用PCA(Principal Component Analysis)降维的方法对数据先进行降维计算再进行聚类计算的思想,在保证信息一定贡献率的情况下简化数据简化计算,大幅度提升了计算的速度。第三,同时提出对油井进行纵向分析,通过对选定的参数用Lasso回归方法进行预测,考虑到参数之间的关系,用参数组预测的方法代替单一参数的预测,提高准确率,为平台提供一个参数预警的功能,通过分析预测结果对油井调控提供意见。最后,基于Python平台,完成了基于PCA降维数据处理,聚类算法的油井分类以及油井参数回归预测的算法仿真验证工作。通过将分类结果与甲方大港油田提供的油井工作状态进行比较,聚类算法可以得到百分之九十以上的准确率,同时基于投票的聚类算法有更高的F1值,表现出更稳定平衡的聚类结果。本文的油井参数分析方法准确性高,计算速度快,已经在油田实际的平台中进行应用,对油井的参数分析生产优化有一定的辅助决策作用,对油田经济效益的提升有着重要的意义。