论文部分内容阅读
数据挖掘是系统数据分析及信息处理的重要方法,其核心研究问题之一是挖掘模型的建立。为了全面分析问题,往往提出很多与系统相关的变量或影响因素。由于属性变量众多,给系统数学建模和性质分析带来困难。实际上,真实系统的仿真模型主要用于模拟系统的主要变化规律并反映重要的性质特征,因此,在缺乏先验知识的情况下,采用粗糙集属性约简方法确定出系统的核心属性、同时滤除不必要的属性,对于挖掘模型的建立和结合进化优化技术进行实际应用具有重要的意义。论文首先阐述分析了数据挖掘的基本方法、挖掘模型和应用技术,以及粗糙集的基本理论、属性约简方法和智能数据挖掘模型建立技术。在研究经典粗糙集属性约简算法的基础上,结合进化算法的特性,分别建立了基于遗传算法和粒子群算法两种粗糙集属性约简方法,并对这两种方法的性质进行了分析。面向模式挖掘和诊断分析问题,分别采用人工神经网络和过程神经网络建立挖掘模型,并提出了一种基于最优分段逼近的过程神经网络训练算法。在基于测井数据的油藏评价中,利用论文建立的的属性约简优化算法对数据属性和数据进行预处理,使得用于建模的数据维度降低,减少了信息冗余,为挖掘模型的建立提供质量较高的数据源。构建一种基于粗糙集属性约简和过程神经网络的数据挖掘模型,将其用于实际资料处理,取得了较好的应用结果。本课题提出了基于粗糙集和优化理论相结合的属性约简方法,可有效约简冗余属性、降低建模数据维度和计算复杂性。利用人工神经网络、过程神经网络提高实际系统的函数逼近能力以及建模的灵活性和自适应性,将其作为挖掘模型,并与属性约简预处理方法相结合,实现了对大数据量的测井信息关于储层岩性、储层流体性质、储层物性参数的信息挖掘,为基于油田测井数据的油气藏评价研究提供了一种新的方法,具有较大的应用价值。