一种基于深度强化学习的油田掺水管网参数优化控制系统

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:kary_yeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高纬度油田的原油由于粘性较大、析蜡较多,常常伴随多种加热方法。当前的生产现场中,某油田采用掺水加热法,在采出原油中混入热水并加压来保证回液温度和压力,维持油田正常的生产流程。由于管网中的油井数量较多,无法精准调控每个掺水阀门的开度大小以及加热炉和加压泵的运行功率,现场采用设备全功率运行、阀门全开的掺水设计,造成了大量的经济损失和不必要的人力消耗。针对这类问题,控制理论和神经网络是尝试解决的经典方案。对于管网系统参数优化控制问题,传统自动控制方法需要制定加热炉和加压泵功率大小以及各阀门开度大小,再利用PID(Proportion Integration Differentiation)等方法进行调整,依赖工程师的现场经验的同时不具备实时调整的设计;神经网络算法可以复现大数据中的控制模式,却无法学习到动态多变的现实环境中的特征。因此目前尚未出现高效可用的解决办法。本论文提出了一种深度强化学习DDPG(Deep Deterministic Policy Gradient)方法,在掺水管网参数优化控制问题上具有自适应环境变化、实时调整参数设置和无需大数据进行训练的优势。该方法结合了深度学习对高维特征的非线性拟合特性,以及强化学习对动态环境进行奖惩的灵活性,实现了多智能体复杂环境下协同决策和参数优化的效果。由于现场工程作业的复杂性和人工密集性,本论文同时设计了基于斯伦贝谢PIPESIM软件的油田仿真管网流动系统,对其中的全部物理模型进行参数设置并通过了可行性检验,为DDPG方法提供了交互获取数据的环境。经过算法设计和模型实验对比,得到掺水管网DDPG模型在奖励值及损失值变化上优于同类模型,存在批次大小和学习率参数的敏感性。在仿真模型中应用,得到17%、4300万元的节电效果,同时满足低于1.39%的理论危险决策率,具备实际应用的潜力。本论文是对目前石油工业深度强化学习应用的较早探索,实现了工业连续决策和连续控制算法的设计和实验,避免了复杂的人工计算和大量无意义数据的收集存储,与传统算法相比达到了更高的理论和实验水平。改进的掺水管网参数优化控制系统为油气田开发工程中相似问题提出了一种可行的思路,同时为扩展到更丰富的应用场景提出了可能。
其他文献
智能制造模式能够平衡个性化定制产品生产的高成本与高附加值,能够满足消费者对产品的个性化要求,其大大推动了个性化定制生产方式的发展。个性化定制生产方式常呈现出多品种
随着中国经济发展进入“新常态”以及新发展理念的贯彻执行,各地区在发展的过程中对环境问题尤为重视并制定了不同的污染排放控制措施,但由于地区间的实际发展存在差异,区域
创新是驱动经济发展的引擎。当今时代,借助技术创新网络合作开展双元创新活动成为企业发展的实际战略需要。网络惯例是一种有效的网络创新合作非契约治理手段,然而由于目前较
1933年出版的《中国建筑史》及其前身的《中国建筑学》讲义是乐嘉藻一生对中国建筑研究的凝结和表达。由于该研究贯穿一生,而其一生(1868—1944)恰又处于近代中国变化最剧烈的时段,因此这一漫长研究不可避免地呈现复杂面貌,或可称为“层累的过程”。本文试图从最终呈现的文本入手,对这一“层累的过程”进行拆解分析,探究其发展脉络和复杂面貌的成因。研究发现,乐嘉藻中国建筑史研究的发展过程实质上是其对于“建
学位
基于高通量测序的无创产前检测技术(Non-Invasive Prenatal Test,NIPT)逐渐趋于成熟,但是通过临床大数据研究发现NIPT依然存在假阳性和假阴性的案例,准确性约为99.99%,而chr1
车道线与车辆检测是自动驾驶环境感知系统中的重要任务,也是车辆后续路径规划、决策与控制的基础。卷积神经网络被广泛研究并应用于各种视觉检测任务的同时,也为智能车辆视觉
恢复是指在工作时间外重建资源,替换这些已耗尽资源的后续过程,以防止资源的进一步损失。现有研究将视角转向下班后恢复活动和恢复体验来研究恢复效果。恢复活动包括高职责活
报童模型是供应链管理中基础模型之一.经典报童模型的研究对象是单周期单产品且需求不确定下零售商的最优订货决策.经典报童问题的决策变量是零售商的最优订货量,决策目标是
由于病毒性疾病具有极强的传染性,而且缺乏即时有效的控制系统,这种疾病已经给人类带来了巨大的损失和痛苦,因此亟需实现对病毒的精准检测。同时,由相似病毒引起的临床表现有
液晶屏老化测试系统通过对液晶屏上电后的定时高温老化测试,剔除不合格的液晶屏。目前大部分液晶屏产线都是大批量生产的,所研发的老化测试系统也是针对单一尺寸液晶屏进行大