论文部分内容阅读
目前,随着油气工作难度的加大,测井资料的处理及解释对计算机软、硬件的依赖程度越来越大,面对大量的采集数据,对数据处理提出了新的挑战。聚类分析在数据分析和数据可视化研究方面是一种高效的工具,正因为聚类分析应用广泛,所以各种不同的聚类算法层出不穷、日益完善。模糊C均值(FCM)算法具有计算机快速实现的优点,是一种现阶段应用领域最为广泛的聚类方法。然而FCM聚类算法有其局限性所在:必须事先指定数据集的聚类数是使用算法的前提条件,但对于没有先验资料的一组数据,其聚类个数一般是很难事先得知的。本文较详细描述了传统FCM聚类算法理论基础,对算法的具体步骤进行了详细的分析,并认识到算法的两个不足之处。为解决在用算法之前必须给定聚类数的问题,本文采用了分阶段思想,引入并改进了最佳聚类数算法来确定分类数,对原FCM算法的目标函数从引入数据权值和更换距离函数相结合的方法进行了改进,以提高算法的运行效率,最后给出了改进的FCM算法的具体步骤。为验证算法的有效性,本文用著名的IRIS数据集进行验证,得到较好的结果。测井数据处理解释过程当中,岩性识别和地层划分是地层评价、油藏描述等工作的一项重要基础性内容。依据不同岩性在常规测井资料中的不同响应,根据改进的模糊C均值算法,对井中的岩性进行分类。使用该方法的最大优点是不需要事先知道各种岩性的物理特性,只需要给定井下岩石的所有种类,该方法就可以将钻孔中所钻遇的岩性识别并划分出来。为研究改进的聚类算法在测井曲线分层中的效果,选取新场气田上的6口井,用改进的聚类算法对其测井曲线分层。以新5井为例,得到4个类别的15个小层。在得到测井数据的类别后,参考测井曲线与岩性的对应关系,画出新5井相类型划分结果。本文用同样的处理方法对其它井的测井数据进行聚类分析,并画出了剖面相图。与已知的岩屑录井对比,吻合度较好,证明了该方法是有实用性的。在测井资料丰富的情况下,改进的聚类算法实用性会更显著。