基于离散型Q学习算法的土石方调配问题研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zoogar002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在水利水电工程建设过程中,土石方调配平衡直接关系到工程建设质量、成本、进度,是水利水电工程施工组织设计和施工管理中重要问题之一。对于大型的土石坝工程,往往开挖、填筑工程量巨大,土石方调配需要综合考虑开挖、填筑、运输、料场存储等诸多施工环节。传统的土石方调配问题多通过构建线性规划、大系统分解协调、动态规划、多目标规划模型等方法求解,但存在一定的局限性。而随着人工智能、机器学习科学理论的发展,强化学习算法在诸多领域得到有效利用。本文针对水利水电工程中的常规土石方调配问题,尝试利用离散型Q学习算法进行土石方调配模型构建及求解分析,并与常规线性规划方法对比分析,证明了该算法的可行性;然后针对土石方动态调配问题,提出了基于神经网络与离散型Q学习算法相结合的土石方动态调配方法,为解决挖填协调问题提供了依据。本文的研究内容及论文架构如下:(1)在对国外土石方调配问题研究现状分析基础上,结合国内水利水电工程施工中土石方调配及存在的问题,提出了本文研究的重点内容和研究方法;(2)在对土石方调运问题系统分析基础上,重点对开挖和填筑工期确定的常规土石方调运问题以及各期开挖和填筑工程量不确定的土石方动态调运问题进行了分析研究,为后续基于Q学习的土石方调配算法提供基础。(3)针对各期各区开挖、填筑工程量已知情况的土石方调配问题,构建了Q学习算法中状态、动作和报酬矩阵,探讨了基于Q学习算法的土石方调配求解方法。通过与土石方调配整数规划算法比较,证明了所提出算法可行性以及构建的Q学习模型的合理性。为强化学习算法解决常规土石方调配问题提供了理论依据。(4)针对各期开挖、填筑工程量不确定的土石方动态调配问题,提出了基于神经网络算法与离散型Q学习算法相结合的土石方动态调配方法。该方法通过神经网络预测各阶段开挖与填筑的可达强度,在此基础上,以待调配工程量、开挖和填筑工作压力系数为状态,以各阶段开挖(或填筑)的工程量、挖填协调规则为动作,并构建了该问题的即时、长期报酬矩阵。(5)针对常规土石方调配问题以及动态调配问题,结合两个水利水电工程,进行了基于离散型Q学习算法的土石方调配分析计算,证明了该模型的有效性。
其他文献
由于工业发展,磷矿资源越来越少,同时磷的过量排放又导致环境的污染。传统的污水处理厂工艺只考虑磷的去除,面向未来污水处理厂,磷同步去除与回收的研究成为一个重要课题。但
葫芦[n]脲(又称瓜环,简称CB[n]s或Q[n]s)及其衍生物是由n个(n=5-14)甘脲单元和亚甲基桥连而成的大环主体分子。由于其合成方法简单,合成原料廉价,内部疏水空腔以及刚性结构和极性
气流染色机由于其所处的气温气压环境,其工作的好坏取决于控制系统的能否在这种极端的环境下实施有效控制,尤其随着用户对染色效果的要求越来越高,对控制方法的稳定性和可靠
近年来,构成企业核心之一的供应链通过控制信息流、物流和资金流,将供应商、厂商、分销商、零售商和用户紧密地连接起来。作为供应链的重要组成部分,物流配送优化中的车辆路径问题也得到了越来越多企业和学者的重视。企业通过对实际运输问题进行分析,可以在一定的假设条件之上建立车辆路径问题的数学模型,并通过模型与求解制定出科学合理的车辆路径规划,从而有助于企业降低运输成本,提高物流运输效率,进而获得更大的经济效益
随着信息容量的增长,传统的硅基存储器将要不能满足信息存储的要求,与此同时,人们对于电子设备的追求朝着微型化和可穿戴化发展。当前迫切需要寻找新的方法同时满足高密度存储和微型可穿戴的需求。近年来基于有机材料的三元有机电存储器件吸引了研究人员的关注,其多元存储以及有机材料的柔韧性有希望解决上述问题。本实验中设计合成了含一个电子给体和两个电子受体侧基的聚硅氧烷PBTPASi,通过对PBTPASi的DCS和
高铁通信是交通通信重要组成部分。随着无线通信的发展和乘客需求的提高,高铁通信质量需要显著的提升。高铁通信主要分为两部分:车地通信和车内通信,车地通信和车内通信也分为上行链路和下行链路传输。本文侧重研究的是车地通信的下行链路传输部分。毫米波频率高、波长短,可以显著提高数据的传输速率,是下一代无线通信的研究重点。毫米波通信可以减少天线尺寸,有利于大规模天线技术的使用。而大规模多输入多输出(Multip
近年来,随着人们生活水平的提高,人们对家具覆饰面料有了更高的要求。在追求实用美观的同时,也越来越追求面料的多功能性。沙发布、台布和靠垫等家具覆饰布广泛应用于家居生
随着生活水平的不断提高,人们对室内环境品质和人体舒适度的要求也是越来越高,而现如今室内环境的调节主要是通过空调控制来实现。传统的空调控制系统都是以温度为控制参数,忽略了室内其他环境和非环境因素对人体舒适度的影响,所以很大程度上满足不了人们的舒适度要求,因此,研究室内热舒适度的有效控制已迫在眉睫。本文采用室内人体热舒适度指标(Predicted Mean Vote,PMV)作为控制对象,利用改进的优
米尔贝霉素A3/A4及其衍生物作为环境友好型杀螨剂、驱虫剂被应用于农业和畜牧业中。冰城链霉菌是重要的米尔贝霉素A3/A4工业生产菌株,具有丰富的次级代谢物产生能力。在其发
儿茶素作为茶叶中多酚类化合物的主体成分,具有抗氧化、清除自由基等多种生理活性,与茶叶品质有密切关系,其中表没食子儿茶素没食子酸酯(EGCG)的含量最为丰富和活性最强。儿茶