推荐系统若干关键问题研究及其在油气开发中的应用

来源 :西南石油大学 | 被引量 : 0次 | 上传用户:leon7779
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字油田通过建立数据银行和信息平台积累了勘探、开发、生产的海量数据。由于技术手段缺乏、测试成本有限、数据管理不善等原因,导致有大量数据缺失。因为现有方法都是基于已有数据对缺失值进行填补,所以已有数据的质量好坏将直接影响缺失值填补的准确度。如何评估采集的数据质量?如何快速填补海量信息的缺失值?在考虑代价的情况下如何进行缺失值填补方案优化?发展中的推荐系统、代价敏感粗糙集等机器学习方法可为解决这些问题提供较好的方案。推荐系统是解决信息过载问题一个非常有潜力的方法,根据用户的需求、兴趣等,对他们可能感兴趣的资讯、产品、方案等做出推荐,其目标是为用户提供个性化的产品和服务,或者帮助用户决策。代价敏感粗糙集是研究代价敏感数据模型表示、代价敏感粗糙集上下近似的定义、代价敏感推荐等问题的理论体系。本文针对油气开发的数据缺失问题,建立基于代价敏感的推荐模型,开发准确高效的缺失值填补算法,着力解决评分数据质量评估、基于评分的高效推荐和基于分类及回归的三支推荐等关键问题。为此,将从数据模型、问题描述、算法设计、具体应用四个层次展开研究,主要的贡献如下:(Ⅰ)数据模型层次。从推荐系统最常用的评分数据模型,到融合用户、项目及评分信息的决策系统;从气井单一参数模型,到考虑气井动静态参数的综合模型;从误分类代价模型到综合考虑误分类、推广、延迟等代价的数据模型。(Ⅱ)问题描述层次。描述了四大核心问题:(1)用户不确定性导致的评分数据质量评估问题;(2)针对海量数据的高效推荐问题;(3)含推荐、不推荐、推广行为的三支推荐问题;(4)基于回归的推荐阈值学习问题。(Ⅲ)算法设计层次。针对上面的四个问题,研究了四类算法:(1)基于正态分布的评分数据质量评估算法。数据的固有性质决定了给定机器学习任务的魔法边界。在相同的评分等级设置下,魔法边界的高低可以用来评估收集数据的质量好坏;(2)基于降维距离函数的高效推荐算法。首先提出了多通道特征向量,只需要O(c)时间来计算两个项目之间的相似性,其中c是推荐系统中不同评分级别的总数。其次提出了一种基于称为M距离的高效算法,只需要O(1)时间来计算两个项目之间的相似性;(3)基于分类的代价敏感三支推荐算法。在推荐系统中引入三支决策,增加一种主动咨询用户以获取其偏好的行为,并通过三支决策和随机森林方法来构建推荐系统;(4)基于回归的代价敏感推荐阈值学习算法,通过调整不同行为的阈值来最小化平均代价。(Ⅳ)应用层次。将上面设计的算法应用到油气田开发领域:(1)利用基于正态分布的数据质量评估方法分析油气田开发数据,并与协同过滤算法计算的结果进行对比,一方面验证该方法在油气田开发数据的适用性,另一方面评估收集数据的质量好坏;(2)利用高效推荐算法填补油气田开发数据的缺失值;(3)结合油气井静态特征及生产动态,建立基于代价敏感的随机森林油气井分类及优选方法。论文的研究工作扩展了推荐系统的理论与应用范畴。在油气田开发的海量数据环境下,研究了基于正态分布的数据质量评估模型,设计了基于降维距离函数的高效推荐算法以降低数据存储空间和时间复杂度,构建了基于分类的代价敏感三支推荐框架以支持人机交互的决策属性获取,提出了基于回归的阈值学习算法来改善分类能力。这些算法的研究对大数据领域中信息过滤及方案推荐具有一定的理论和实际意义。
其他文献
羟丙基瓜尔胶压裂液是致密砂岩储层压裂改造中广泛使用的工作液体系。作为稠化剂的瓜尔胶进入储层会与岩石多孔介质发生吸附滞留作用,导致油气渗流通道减小甚至完全堵塞,进而影响储层增产改造效果。目前对于瓜尔胶在砂岩多孔介质中的吸附滞留机理和规律认识不清,使得瓜尔胶压裂液的吸附滞留伤害得不到有效控制,制约着致密砂岩油气资源的开发效果。因此,本论文以砂岩多孔介质为研究对象,重点研究瓜尔胶在砂岩多孔介质中的吸附滞
学位
我国页岩气资源丰富,但是在页岩气水平井钻井过程存在的井壁失稳问题,严重影响着页岩气规模化开发进程。下志留系龙马溪组页岩气储量占全国页岩气资源量的20%,勘探开发前景广阔。论文选择龙马溪组硬脆性页岩地层为研究对象,通过对该地层页岩特性评价,分析了其水基钻井液致塌原因,并提出了水基钻井液防塌对策;针对该地层特性进行了封堵剂分子结构设计,研制出了一种新型纳米封堵剂NPS-1;通过实验研究揭示了其作用机理
学位
工业生产中常常涉及到环境污染问题,水污染是最为棘手的问题之一。水体污染物种类繁多,常见的有有机小分子染料,重金属离子和原油等。现阶段研究的水处理材料仍具有一定的局限性,如处理效率低,循环利用性差,易二次污染等。因此,针对目前暴露出的问题,研究开发出一系列具有高效、环保、节能的新型水体污染物处理材料具有重要意义。作为一种优良的天然高分子多糖,胍胶因其独特的半乳-甘露糖直链结构以及优良的增黏性和水溶性
学位
对于低渗透轻质油藏,常常存在注水压力过高、注水困难的问题。注气开发是改善低渗油藏开发效果的有效方法,气驱当中空气驱技术具有气源丰富、注入成本较低的优点,并且空气能够与地层原油发生氧化反应,产生的热效应能够额外提高原油采收率。目前在不同条件下针对原油氧化机理和氧化模式的研究不够深入;氧化热效应对轻质油藏注空气采收率贡献大小、形成的烟道气能否通过多次接触与油藏原油混相这两个方面学术界始终存在较大争议;
学位
光与物质在纳米限域空间相互作用的研究对表面科学和光物理都具有重要意义。本论文中我们研究两类典型限域体系中光与物质的相互作用。一类为光通过表面等离激元共振效应聚焦限域在纳米结构表面,从而特异地增强与表面分子和金属原子的相互作用,实现表面增强拉曼散射和表面等离激元增强的金属光致发光。另一类为材料自身的空间限域使得激子离域于二维平面形成二维激子,从而实现与光的强相互作用。本论文的主要研究工作如下:1.建
学位
化学驱作为一项重要的提高原油采收率技术,在我国老油田控水稳油的开发需求下取得了良好的现场应用效果。然而,常规化学驱技术存在高温高盐条件下稳定性差、非均质性条件下波及效率低等问题,难以满足高温高盐油藏水驱后进一步提高采收率的需求。针对这一技术需求,本文提出了分散胶-乳化表面活性剂复合调驱技术,以塔河油田G油藏(油藏温度92℃、地层水矿化度214182.2mg/L)为目标油藏展开了研究,制备出了适用于
学位
随着世界经济的快速增长,能源在经济发展中的地位越来越重要,世界各国都加快了能源储备的步伐。自从2000年国务院批准启动“西气东输”工程以来,我国也加入了地下能源储备建设的队伍。由于盐岩层具有渗透性低及损伤自愈合的特性,因此盐穴地下储气库被认为是天然气储存的理想场所。我国地下盐岩层的地质特性具有盐层薄、岩盐品位低、难溶夹层多而密、地质条件比较复杂的特点,与国外高品位、厚盐岩层的特性差异较大,因此需要
学位
随着中、轻质原油不断枯竭,其重质化日趋严重,原油开发利用亟需从常规到非常规原油转变。原油开采逐步转向稠油及特超稠油资源,开发区域亦从陆地向近海、深水延伸。然而,海洋稠油-水混输管线停运再启动面临诸多挑战,特别是复杂海管停输后油水两相运移规律、启动应力变化及其与再启动压力关系尚缺乏充分认识。同时对海上无人平台,稠油停输管线启动作业、置换复产也是设计与自动化实施的难点。为此,以旅大稠油为研究对象,采用
学位
The changing climate is a global phenomenon and a challenge for both current and future generations,which scientists around the world overwhelmingly attribute to human activities that release greenhou
学位
我国有丰富的页岩气资源,技术可采资源量达21.8万亿立方米,探明率仅4.8%,资源潜力巨大。页岩气是油气勘探开发的非常规领域,其开发理论、技术和政策等都有别于常规油气,开展页岩气相关理论、方法研究对页岩气的规模有效开发有重要的理论和实际意义。页岩储层渗透率极低,必须经过压裂改造才能形成有效产能。目前,工厂化水平井钻井、数万方液、数千方砂的大规模水平井分段多簇压裂成为页岩气开发的主体技术,通过大规模
学位