基于Q学习算法的发电公司决策新模型

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:rongerxingfu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了基于Q学习的发电公司决策新模型,应用于求解发电公司在具有不完全信息的电力市场环境下为获取最优长期利润而制定的决策问题.以电力市场重复运行具有的典型Markov过程特性,应用Q学习算法构建以长期利润最优为目标的发电公司决策模型,并通过算例仿真验证了该模型的有效性.所提出的决策新模型可以根据发电公司对市场状态变化的不同预估状态转移概率模拟该公司在市场环境下的不同竞价策略,并给出不确定市场环境下的最优决策.
其他文献
研究了采用全氟四氢辛基硅烷(F13-TCS)对纳米压印技术中所用SiO2模板进行表面修饰的情况,分析了用气相法在SiO2模板表面形成F13-TCS单分子膜的形成过程及化学机理,并用X射线光电
提出一种基于IP的超微蜂窝系统中BSSMAP(BSS Mobile Application Part)信令和话音的传输控制协议——BSTP(BSSMAP Simplified Transport Protocol).采用基于BSTP的传输系统,可以实
为降低收发机成本,在声表面波射频识别系统中采用频域取样,并利用频率步进连续波作为发射信号.为了进一步提高识别距离及系统的抗干扰能力,增强标签在小信噪比下的识别能力,
开发新的基于数字散斑相关方法(DSCM)的摄像机控制拉伸实验方法,在温度25-150°C和应变率10-5-10-3s-1范围内进行一系列的恒应变率拉伸实验,得到真应力-真应变关系和空洞
用不同修饰剂在水相中合成了CdTe半导体量子点(Quantum Dots,QDs).通过紫外吸收光谱(UV—VIS)、荧光发射光谱(PL)、Zeta电位等方法对制备的样品进行了表征.实验结果表明:选用同一修饰剂
提出一种基于DCT变换域的图像类水印算法,该算法不对原始数据进行修改,只要通过环形自同构计算原始图像和认证图标DCT系数间的映射规则,在验证端再通过该映射规则来恢复认证图标
针对附连在无限大障板上的复合自由度波导抑振器(Combined DOF Waveguide Suppressor),用等效的Timoshenko粱理论描述了它的自由振动并确定了该问题的精确解,基于声辐射模态理论
通过陈述大面积敷铜箔板的焊接特点,指出采用SMT工艺组装大面积敷铜箔板的难点;详细阐述了采用DFM原则提高设计质量、严格控制印膏质量和合理设置再流焊接温度曲线3个方面的
从9月份开始,华南化工价格指数一路走高,到10月中旬达到1341.71点,接近1400点,创近两年来新高,这也说明这段时间内国内化工品市场势头正盛。但好景不长,11月份开始国内化工品
从可制造性设计(DFM)的定义和trilogy 5000软件开始,说明了印制电路板(PCB)板级DFM的必要性.简述了PCB板上元器件的选型所遵循的标准和Mark点的设立原则.详细叙述了焊盘的设