基于中介Agent的强化学习优化协商模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:chenpenghust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于强化学习的双边优化协商模型。引入了一个中介Agent。在强化学习策略中使用不同的参数产生提议,进而选出最好的参数进行协商。为了进一步提高协商的性能,还提出了基于中介Agent自适应的学习能力。仿真实验结果证明了所提协商方法的有效性,且该方法提高了协商的性能。
其他文献
随着大气数据计算机、飞行参数记录系统、综合导航系统、发动机参数记录系统等一大批综合电子化设备加装飞机,对其进行可靠和有效的综合维修,部队需求在不断增加。首先从部队实
设计了一种无人机视频压缩与传输系统;采用TMS320C2812进行系统控制,通过集成图像传感器OV7620完成图像信号的采集和数字化处理,以ADV612芯片对采集图像进行小波变换;经过CPLD和DSP完成变换域数据的压缩和转换发送;图像的无线传输使用甚高频数字电台;地面站解码后,送入上位计算机进行图像处理;系统时间延迟较小,实时性较强,基本满足工程实际需要;对SPHIT算法中的零树结构进行改进,给
在信号稀疏度未知的情况下,稀疏度自适应匹配追踪算法(Sparsity Adaptive Matching Pursuit,SAMP)是一种广泛应用的压缩感知重构算法。为了优化SAMP算法的性能,提出了一种改进
在图像检索领域中,为了更加方便、高效地进行图像检索,文中提出了一种新的图像检索特征——局部自相关特征,为基于内容的图像检索提供了新的工具,它兼具方向特征和纹理特征。利用提出的局部自相关特征在Corel10K图像库上进行了大量的实验,实验结果表明局部自相关特征的平均检索精确度和召回率虽然低于颜色特征,但高于方向特征,是除颜色特征之外又一个高效的图像检索特征。
提出一种选择性集成学习算法,该算法利用多线程并行优化基分类器的参数,通过多层筛选和动态更新筛选信息获取最优的候选基分类器集合,解决了以往在集成学习中选择分类器效率低下
进行图像边缘检测的算法有很多种,其中基于Sobel算子、Laplace算子、Canny算子等的图像边缘检测方法当属经典。但所提方法不同于这些差分算子方法,而是对灰度图像素进行小窗口区域的核密度估计,从而得到一幅核密度图,然后通过核密度图,选择出合适的带宽或阈值来控制图像边缘的检出。实验表明该方法可行且简单快速。
目前,野外环境下的数据采集主要还是依靠数据采集员手工填写预置表格,然后交给数据录入员输入计算机数据库中。这种数据采集手段涉及多人作业,其流程复杂,数据质量难以保证且
为推广内话及录音机检查仪的研制成果,阐述了某型飞机内话及录音机检查仪设计思路、原理、软件流程和机械传动结构设计;该项目的关键技术为硬件应用单片机控制技术及机械传动结
提出了一种提高扫略曲面三坐标加工速度的优化方法;在曲面加工中,经常使用比较昂贵的商业CAD/CAM软件来生成加工程序,对刀具位置和路径规划进行大量的计算;由于这些商业软件都基于一种比较可靠的算法,所以在功能上都具有相似的功能和效率;也就是说,现在使用的大多数的CAD/CAM系统,都是基于零件的几何特征来加工的;文中提出了主要集中在提出一种基于被加工零件精度自由曲面刀具路径生成方法,推导出前进步距函
针对矿山机械设备的振动数据在信号滤波和故障信号数据保存及提取方面存在的问题,提出了神经网络优化阈值的小波变换方法。采用MEMS三轴加速度传感器采集数字量,对其运算处理