论文部分内容阅读
近年来,在经济的快速发展下,中国对石油等能源的需求量逐渐增大,加上技术水平的限制及产业结构的调整等多种因素,中国石油产量远不能满足需求,到2017年为止,中国石油的对外依存度已经连续9年超过警戒线,并持续保持上升的趋势。这说明我国的石油供需矛盾进一步凸显,为了缓解这一矛盾,石油的增储上产是需要采用的必不可少的一种重要措施,而精确的识别石油储层能够使增储上产得到有力的保障。石油储层识别中主要包括储层含油性识别和关键属性预测两方面。其中,储层识别是储层评价、油藏描述、实时钻井监控等方面的一项重要内容,而储层含油性识别是储层识别的重要内容,是将测井信息还原为地质信息,体现测井解释成果和应用价值的高级阶段,它将直接影响石油勘探的效率与成功率。而在储层含油性识别中,关键测井属性对识别率的影响较大,测井属性的描述信息是否完整、是否存在冗余、是否与储层分类相关对最后进行石油储层分类的准确程度有直接的影响,同时管理人员对储层含油性分类的了解程度将会直接影响到其做出决策的合理性。因此如何从众多测井属性中筛选出关键测井属性,得到关键测井属性后如何将其转化为容易理解的知识信息显得尤其重要。为了解决测井数据中的关键属性提取问题和知识转化问题,本文首先致力于研究特征选择技术在测井属性集上的应用,然后在此基础上利用规则提取将关键测井数据转化为知识信息。本文在考虑了特征选择中各种评价算法、分类算法以及搜索策略的优缺点,以及规则提取中规则冲突的解决方案、规则集的评价准则以及搜索策略的优缺点,提出一种新的特征选择算法和规则提取算法。两种算法中都选择差分演化算法作为其选择策略。考虑到差分演化算法对控制参数的设置较敏感及局部搜索能力较差等问题,本文首先对差分演化算法进行改进。差分演化算法改进的基本思想是先通过正态分布和高斯分布生成一组缩放因子和变异概率,接着对这组控制参数进行变异操作生成一组新的控制参数,然后根据这两组控制参数对两个种群进行交叉、变异及选择操作,同时在选择操作中加入了模拟退火的思想,以便提高算法的全局搜索能力。为了测试改进差分演化算法的性能,本文将算法在17个基准测试函数上进行测试,并与其他几种常用的差分演化算法的测试结果进行比较,并对比较结果进行分析。分析结果表明,改进差分演化算法的整体性能要优于其他几种算法。随后,在改进的差分演化算法作为搜索策略算法的情况下,新的特征选择算法采用基于距离评价准则的ReliefF算法和基于信息评价准则的BIF算法、FCBF算法,以及随机抽取特征算法作为特征的评价准则算法对测井属性进行排序;选择模糊C均值算法、SOM神经网络算法、K均值算法和K近邻算法作为分类算法。新的特征选择算法采用特征选择的Filter模型和Wrapper模型相结合的方式,将改进的差分演化算法和特征选择算法融合,即先通过特征选择算法对属性根据与分类的相关度由高到低的进行排序,然后通过改进的差分演化算法随机生成选择属性的个数,根据对应的特征选择算法中对属性的排序结果,由高到低的选择出相应个数的属性作为属性子集,接着从属性数据集中选出对应的属性子集数据,然后把这些属性子集数据用相应的分类算法进行分类,并计算最后的分类准确率作为评断属性子集的标准。为了测试新的特征选择算法的性能,本文利用5个基准数据集进行算法的测试,即将新的特征选择算法的测试结果与其他几种特征选择算法的结果进行比较,同时将测试结果与未进行特征选择的测井属性数据集分别在模糊C均值算法、SOM神经网络算法、K均值算法和K近邻算法上进行分类的结果进行比较,并分析比较结果。分析结果表明,新的特征选择算法能够在保证识别率较高的情况下提取关键特征,因此该算法性能较优。最后将新的特征选择算法应用到江汉某油田的5口井的测井数据集上,对关键测井属性进行提取,剔除冗余测井属性,为下一步将属性数据转化为规则知识做准备。最后,在改进的差分演化算法作为搜索策略算法的情况下,新的规则提取算法采用“first-come,first-served”和“最大隶属度原则”来处理规则集中的冲突问题;选择分类精度、规则集中的规则数、规则集中的前件总数和没有被规则集覆盖的样本总数作为规则集的评估标准。新的规则提取算法的个体编码包括三部分内容:分类规则、控制参数和适应度值,其中分类规则包含了规则控制值、多个规则前件以及分类标签,而每个规则前件又包含了四个部分:前件控制值、前件连接类型、和两个常数。其中连接类型采用包括在内、大于等于、小于等于、不包括在内四种形式,以便于处理连续问题。为了测试新的规则提取的算法的性能,本文利用10个基准数据集对算法进行测试,即将算法的测试结果与其他四种规则提取算法的测试结果进行比较,并对结果进行分析。分析结果表明,新的规则提取算法在综合考虑识别率和规则集的可解释性时,性能优于其他算法。最后将新的规则提取算法应用到经过属性约减的测井数据集上,将测井属性数据与储层分类间的关联以”IF-THEN”的知识形式表示,以便于非专业人员能够更容易的了解储层的分类信息。本文主要的创新点包括:(1)提出了一种基于模拟退火的增强型参数自适应差分演化算法,即ESADE算法;(2)将ESADE作为特征选择的搜索策略应用于特征选择算法上,提出了一种基于ESADE的特征选择算法;(3)将ESADE应用于规则提取方法,提出一种基于ESADE的规则提取方法。