基于强化学习的无线传能网络节点控制算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：wuyishijian

【摘要】

：

以无线传能网络的节点控制问题为研究对象,针对统一化的节点模型设计一种基于策略梯度的强化学习算法.该算法使用神经网络作为控制器,并设计一套奖励机制用来评估控制结果的优劣,以最大化累计奖励为目标优化网络参数,使神经网络控制器达到更好的控制效果.仿真结果表明,只需设置对控制结果的奖励机制,就可以让节点根据供电需求的变化学习到对应的控制策略,适用于近似周期性的供电场景,也适用于极端情况的供电控制.

【作者】

：

吴振宇吴凡李云雷

【机构】

：

大连理工大学创新创业学院辽宁大连116024

【出处】

：

计算机应用与软件

【发表日期】

：

2021年12期

【关键词】

：

强化学习策略梯度机器学习电网控制无线传能

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

一种结合BERT与双层LSTM的复杂长句意图分类方法

传统文本分类方法从复杂长句中提取特征的能力有待提高.为准确识别与分类复杂长句意图,构建一种结合BERT(Bidirectional Encoder Representation from Transformers)迁移学习与长短时记忆网络LSTM(Long Short-Term Memory)的分类方法.使用BERT获取上下文相关的动态词向量,捕捉传统模型难以表示的一词多义特征;在BERT输出层接入LSTM网络,经由词级、句级双层LSTM层次化提取特征,获取细粒度语义表示,进而对句子意图进行准确分类.实验

期刊

复杂长句句子分类迁移学习BERT双层LSTM

基于改进的U-Net肺结节分割方法研究

由于肺部CT图像的特征信息复杂程度高,经典U型卷积网络对肺结节分割存在准确率较低和误分割等问题.针对这一问题,提出一种改进的U型卷积网络模型.该模型将U-Net网络和DenseNet网络融合,将解码器浅层特征连接至深层特征来增强特征的复用性.通过U-Net网络与卷积条件随机场(ConvCRF)的端到端结合训练来增强边缘特征,解决了边界模糊的问题.提出一种改进的focal loss损失函数,该函数提高了结节所占的权重,解决了正负样本不平衡的问题.在LUNA16数据集中作对比实验验证了模型的性能,分割精准度达

期刊

肺结节分割U型卷积网络密集连接损失函数卷积条件随机场

英语学习者作文自动评分特征选择及模型优化研究

通过集成学习方法,探索影响英语学习者作文质量的语言特征,提高现有作文自动评分系统的准确率.基于剑桥FCE考试数据集,使用支持向量回归和随机森林算法筛选特征,构建并评测自动评分模型.与现有方法对比实验的结果表明,基于集成学习的评分模型准确率有所提升.该方法可以有效评估英语学习者的作文质量,有助于开发面向大规模机考和网络自主学习平台的作文自动评阅系统.

期刊

英语学习者作文自动评分集成学习特征选择自然语言处理

基于深度学习的颈部淋巴结超声图像分割方法

提出一种基于掩膜区域卷积神经网络(Mask R-CNN)结构的方法,实现对颈部淋巴结超声图像的分割.采用迁移学习方法训练网络,获取颈部淋巴结图像的分割结果.实验结果表明,该方法的Dice系数达到了0.9124,相较U-Net网络提高了13.74％,显著提高了颈部淋巴结超声图像的精确度.

期刊

Mask R-CNN颈部淋巴结迁移学习超声图像图像分割

基于草图拓扑约束的陶瓷产品造型参数化设计

计算机辅助设计在陶瓷产品设计制造领域仍处于应用初始阶段.为提高陶瓷产业信息化程度,提高产品设计效率及满足产品个性化定制需求,根据陶瓷器具造型特点,提出一种草图约束下陶瓷产品参数化三维模型生成算法.算法利用草图尺寸、结构信息借助计算机三维模型生成技术参数化绘制产品三维模型,通过参数调整及交互设计实现产品变型.实验表明该算法具有极强的实用性,实现了陶瓷产品便捷设计.

期刊

陶瓷产品造型参数化草图拓扑三维模型快速造型

Top-k近似否定约束的发现

现有的约束发现算法主要讨论了函数依赖或者条件函数依赖,忽略了实际的约束包含大小关系的语义问题.否定约束可以描述字段级和表级约束,除了相等与不等,还可以表示大于和小于的次序关系,因而具有极强的语义表达能力.提出一种Top-k近似否定约束的发现算法,可以快速地发现数据库中评估指标好的近似否定约束.实验表明,该算法在时间上明显快于在所有近似否定约束结果集上查找Top-k约束,得到的结果集在评价指标上与近似否定约束结果集上查找出来的Top-k相近.

期刊

否定约束近似约束约束发现

一种基于差分隐私的频繁有权子图挖掘算法

目前,在保护频繁子图数据的研究领域中,关于保护带有边权重的子图数据还没有被研究.针对这一问题,在频繁有权子图的挖掘过程中,采用差分隐私技术兼顾地保护频繁子图的边权重和结构的隐私,提出Diff-Wfsm算法.通过扩展已有挖掘算法,将图模型转换成编码形式,并将权重值考虑到编码中.为了更好地保护结构的隐私和提高数据效用性,在挖掘过程中同时采用差分隐私的Laplace机制和指数机制.实验在多个真实数据集中进行,结果表明该算法能在挖掘过程中达到隐私保护的效果,并可以保证输出的频繁有权子图具有较高的数据效用性.

期刊

差分隐私Diff-Wfsm算法数据效用性Laplace机制频繁有权子图

基于ARMA-LSTM组合模型的铁路客流量预测

单一模型在铁路客流量预测中很难同时捕获到数据序列的线性、非线性和周期性等多种特征,从而无法取得很好的预测效果.针对该问题提出基于机器学习的ARMA-LSTM组合模型预测方法.对原始数据进行分析和特征提取;训练LSTM(Long Shot-Term Memory)模型和ARMA(Autoregressive moving average model)模型,分别得到两模型预测结果;通过BP神经网络算法对两模型进行权重优化,得到预测结果.将ARMA-LSTM组合模型与ARMA、LSTM、灰色模型、GM-LSTM

期刊

时间序列机器学习LSTM神经网络组合预测模型

基于HNP模型的强化学习状态空间表示方法

蛋白质结构预测是生物信息领域中具有挑战性的问题之一.将强化学习运用在HNP晶格模型的最优结构发现中,性能出色,但结构预测所需的状态空间巨大,容易导致维数灾难问题.在全状态空间基础上,进一步提出半状态空间与简单状态空间方法,以达到约减状态空间的目的,同时对奖赏函数与策略进行定量分析.实验结果表明,该方法有效解决全状态空间无法计算长序列的缺点,其中简单状态空间较全状态空间有3条序列预测出更低能量,半状态空间较全状态空间方法全部6条长序列都预测出更低能量,且半状态空间预测的能量平均值较简单状态空间降低了9.83

期刊

强化学习HNP模型维数灾难状态空间

基于PSO优化博弈的区块链共识算法

针对现有的区块链共识算法存在决策不均衡、适用性过小和产生共识困难等问题,根据纳什均衡理论,将区块链节点视为博弈的参与者,在共识过程中将节点策略选择的纳什均衡作为共识目标,提出基于纳什均衡的共识算法.在纳什均衡求解中利用聚类算法对同类型节点聚类,用基于拥挤距离和引力搜索算法改进的粒子群优化算法求解以类为基本种群的纳什均衡近似解,将均衡解下所对应的结果作为主节点.设计面向组合投资区块链系统求解共识机制的实验,分别从算法的安全性和扩展性验证该算法的有效性.

期刊

共识算法博弈纳什均衡聚类粒子群算法

基于强化学习的无线传能网络节点控制算法

与本文相关的学术论文