【摘 要】
:
提出一种基于强化学习的生成对抗网络(Reinforcement learning-based Generative Adversarial Networks,Re-GAN)能耗预测方法.该算法将强化学习与生成对抗网络相结合,将GAN(Generative Adversarial Nets)中的生成器以及判别器分别构建为强化学习中Agent(生成器)以及奖赏函数.在训练过程中,将当前的真实能耗序列作为Agent的输入状态,构建一组固定长度的生成序列,结合判别器及蒙特卡洛搜索方法进一步构建当前序列的奖赏函数,
【机 构】
:
苏州科技大学电子与信息工程学院,苏州215009;苏州科技大学江苏省建筑智慧节能重点实验室,苏州215009;苏州科技大学苏州市移动网络技术与应用重点实验室,苏州215009;珠海米枣智能科技有限公司
论文部分内容阅读
提出一种基于强化学习的生成对抗网络(Reinforcement learning-based Generative Adversarial Networks,Re-GAN)能耗预测方法.该算法将强化学习与生成对抗网络相结合,将GAN(Generative Adversarial Nets)中的生成器以及判别器分别构建为强化学习中Agent(生成器)以及奖赏函数.在训练过程中,将当前的真实能耗序列作为Agent的输入状态,构建一组固定长度的生成序列,结合判别器及蒙特卡洛搜索方法进一步构建当前序列的奖赏函数,并以此作为真实样本序列后续第一个能耗值的奖赏.在此基础之上,构建关于奖赏的目标函数,并求解最优参数.最后使用所提算法对唐宁街综合大楼公开的建筑能耗数据进行预测试验,实验结果表明,所提算法比多层感知机、门控循环神经网络和卷积神经网络具有更高的预测精度.
其他文献
汽车补漆机器人需要面对各种不同大小的车型,适配各种造型曲面和颜色,这种高度自适应要求使得补漆机器人在目标跟踪、路径规划、运动空间等方面的设计难度远超汽车厂的喷漆机器人.因此需要重新规划喷漆路径,首先对汽车的点云数据进行分部位切割,然后以八邻域法计算封闭曲面轮廓,最后以切片法在曲面上生成光栅轨迹,形成了每一个补漆面的关键路径.设计了八轴桁架机器人系统,用蚁群算法计算生成八轴联动时的路径规划,再通过倍福的ADS协议将路径数据和梯形曲线的加速度下发到PLC运动控制程序,完成各关节轴的联动协同补漆运动.实测表明,
Protein phosphatase 2A(PP2A)is a major serine/threonine phosphatase which participates in the regulation of multiple cellular processes.As a confirmed tumor suppressor,PP2A activity is downregulated in tumors and its re-activation can induce apoptosis of
In late December 2019,COVID-19 was firstly recognized in Wuhan,China and spread rapidly to all of the provinces of China.The West Campus of Wuhan Union Hospital,the designated hospital to admit and treat the severe and critically ill COVID-19 cases,has tr
In recent years,the impact of new major infectious diseases on people\'s normal life is becoming more and more frequent,which has brought great impact on people\'s life safety and social economy,especially the corona virus disease 2019,which has been
Alzheimer\'s disease(AD)is a chronic neurodegenerative disease that mainly causes dementia.It is a serious threat to the health of the global elderly population.Considerable money and effort has been invested in the development of drug therapy for AD wo
The role of corticosteroids in the treatment of coronavirus disease 2019(COVID-19)is controversial.In the present study,we evaluated the effects of adjuvant corticosteroids treatment on the outcome of patients with COVID-19(n=966),using Propensity Score M
Fluorescent nanoparticles have good chemical stability and photostability,controllable optical properties and larger stokes shift.In light of their designability and functionability,the fluorescent nanoparticles are widely used as the fluorescent probes f
Microglia are the major immune cells in the central nervous system and play a key role in the normal function of the brain.Microglia exhibit functional diversity,and they control the inflammation in central nervous system through releasing inflammatory cy
新冠疫情的暴发,学生教工无法返校的情况下,绝大多数高校采用VPN的方式保证远程学习和科研.为了解具体情况,采集了2020年2月至2020年9月新冠疫情期间北京大学的VPN日志,从使用人数、登录登出时间、使用时长、聚类分析、用户类别5个方面进行讨论.VPN每日使用人数最高约1.5万,同时在线人数最高约0.5万,每日的用户平均使用时长最高325 min,几项数据表明,学生教工高度依赖VPN进行远程学习和科研,根据用户的每日平均使用时长和使用天数对用户进行聚类分析,可以大致将用户分为4类;对用户类别进行分析,理
在智能化技术革新各个传统行业的过程中,对于传统病房护理人们提出了更高水平的服务诉求.在传统病房实地调研的基础上,为了提高患者日常病房生活中的自理能力,加强医护和家属对病人生活状况的实时监控,结合现有物联网智能控制技术,本文提出一种融合语音和脑电的智慧病房控制系统,实现了病房电器等基础设施的控制和云端病房实时监测.此外,基于眨眼动作的ElectroEncephaloGraphy(EEG)控制方法在一定程度上解决了对患者身体状况的更高要求的问题.根据涉及10名受试者的两个实验,语音识别的准确度达到98%,对健