面向复杂储层岩性识别的非均衡数据分类算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:qijing1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,非均衡数据的分类问题引起了众多研究学者的关注和讨论。在地质勘探领域,岩石数据呈现非均衡特征的情况也多有发生,加上复杂储层存在勘探难度大等问题,传统的计算机辅助方法,很难对复杂储层进行储层描述和岩性识别。本文通过分析发现,复杂储层中岩石数据均为非均衡数据,且其中某几类岩石具有高相似度。因此,在研究了非均衡数据分类算法的基础上,提出了面向复杂储层岩石数据的二分类和多分类算法。本文具体研究工作如下:一、分析复杂储层岩石数据的样本特点,提出基于聚类及样本迁移的岩石数据均衡化算法(cluster and samples move based on feature distance),简称 C&SM 算法。该算法对多数类样本进行聚类分组后,判断多组多数类子样本的样本量,当子样本间再次出现非均衡现象时,采用基于特征距离的样本迁移方法进行二次处理;最后,把若干均衡多数类子样本与少数类样本组合,构成新的岩石数据集。本文提出的算法,不但避免了重采样造成的数据缺失或原始数据分布改变的问题,同时解决了二次非均衡现象对岩性识别的影响。二、围绕高相似度非均衡岩石数据的二分类问题,研究不同地层元素对识别复杂储层岩石数据的重要程度,提出基于地层元素特征权重的集成规则。在该类数据上,算法的AUC值至少可以达到0.93。三、围绕复杂储层岩石数据的多分类问题,提出了岩石样本融合策略及基于多层漏斗型的(multi-label imbalanced data classification based on multi-layer funnel)MICMF分类模型,通过融合策略把多类别非均衡数据转化为多类别均衡数据后,利用MICMF模型进行最终的岩性识别。实验表明,该算法在13个含油气盆地上的平均识别准确率可以达到92%,精确率可以达到84%。
其他文献
随着经济的快速发展,我国对能源的需求越来越大。我国在煤矿安全方面的工作做的还不是很完善,这就导致了煤矿事故频频发生。煤矿安全成了我们讨论的热门话题。从安全的角度出
随着云计算技术的不断发展,融合多个云计算环境的混合云越来越得到广泛的应用。在许多科研应用程序中,要得到最终结果需要执行一系列任务。而这些任务,如数据生成、处理、分析等
Hadoop是当今应用最为广泛的开源云计算平台,主要由Hadoop分布式文件系统(HDFS,Hadoop Distributed File System)和MapReduce框架组成。   当前Hadoop分布式文件系统采取的
足球机器人比赛是近年来国际上兴起的一种高科技竞赛活动。足球机器人分为两大系列:FIRA系列和RobCup系列。足球机器人是集机器人学、智能控制、数据融合、计算机技术、无线
近几年,3D游戏产业已从国外逐步走向国内市场,且发展势头趋于猛进。很多大公司都已转手投资游戏产业,希望在市场上能够赢得一席之地,毕竟这是个新兴产业,在国内还处于初期发
随着CAD/CAM的迅速发展,人们对产品的几何外形设计提出了更多更高的要求,用于产品几何外形设计的曲面光顺和过渡曲面构造方法受到了极大的重视和广泛的研究,已成为当前的研究热
近年来,随着网络的快速发展,各行业、各领域越来越多地利用计算机网络来进行数据存储、传递和交换,用户对信息的安全保护需求愈益迫切。由于椭圆曲线密码体制(ECC)所具有的诸
BitTorrent是最流行的文件共享协议,作为P2P技术的主要应用之一,多年来取得了极大成功。在BitTorrent中,激励扮演着重要角色,它鼓励用户上传资源,以便获得较短的下载时间。然
目前移动网络已经成为智能终端获取信息资源的主要方式之一,而移动网络数据传输过程中产生的尾能耗,是导致智能终端能源效率低下的关键因素,因此合理有效地降低智能终端的尾
在基于J2EE的应用开发中,架构是技术实现的关键,随着J2EE的不断发展,涌现出大量的开源轻量级框架。而一些企业在应用开发中要求对架构的设计在追求尽量缩短研发周期、降低研