基于增强学习的多agent自动协商研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：bill119

【摘要】

：

该文通过对协商协议的引入，对提议形式、协商流程的分析，结合多属性效用理论和连续决策过程，提出了一个开放的、动态的、支持学习机制的形式化多问题自动协商模型：并在模型的基础

【作者】

：

杨明嘉莉邱玉辉

【机构】

：

西南师范大学计算机与信息科学学院

【出处】

：

计算机工程与应用

【发表日期】

：

2004年33期

【关键词】

：

增强学习自动协商 Q学习评估提议 reinforcementlearning automated negotiation Q-learning evalua

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文通过对协商协议的引入，对提议形式、协商流程的分析，结合多属性效用理论和连续决策过程，提出了一个开放的、动态的、支持学习机制的形式化多问题自动协商模型：并在模型的基础上分别对评估提议、更新信念、生成提议等协商过程作了详细描述；对传统Q学习进行了扩充，设计了基于agent的当前信念和最近探索盈余的动态Q学习算法。

其他文献

β-淀粉样肽神经细胞损伤模型的建立及应用

目的：建立β-淀粉样肽神经细胞损伤模型，探讨工具药维生素E，加兰他敏，四乙基铵，多奈哌嗪对Aβ25-35孵浴造成细胞损伤的影响，寻找具有抗Aβ损伤作用的工具药。方法：（1）应用不同浓度Aβ2

期刊

细胞损伤模型Β-淀粉样肽神经细胞AΒ25-35MTT法检测细胞存活率mol/L维生素E加兰他敏

砀山大面积推广果树壁蜂授粉

安徽省砀山县现有酥梨、苹果、桃、杏、李、葡萄等多种果树0．39万hm^2。自2006年引进角壁蜂，先后在苹果、桃两种果树花期进行试验放蜂授粉，取得了良好的授粉效果。今年该县又在

期刊

壁蜂授粉砀山县大面积推广果树砀山酥梨放蜂授粉授粉效果果业协会

婴儿型戈谢病一例

期刊

婴儿型戈谢细胞戈谢病

止痛膏外敷治疗癌痛的疗效观察及护理

为了提高癌痛患者生活质量，WHO制定了癌性疼痛解除计划，即三级药物阶梯止痛法，但长期使用镇痛剂毒副作用大，成瘾性、依赖性强，并受患者耐受性的限制，致使部分患者止痛效果欠佳。我

期刊

癌痛患者外敷治疗疗效观察止痛膏护理止痛效果疼痛部位阶梯止痛法

数据挖掘在石化企业中的应用

产量预测时于生产和销售部门是极其重要的。在石化企业中，由于影响主副产品关系的因素很多，产量很难预测。传统的机器学习方法在这个领域的应用存在着一些局限性。论文介绍了一

期刊

数据挖掘支持向量机数据仓库Data Miningsvmdata warehouse

浅议会计监管体系中的政府监管

近几年，欧美及中国不断发生会计造假丑闻，对社会产生很大影响。本文从会计信息失真的现状入手，并试图从建立完善的会计监管体系、尤其是加强政府监管方面提出有效的治理方法。

期刊

会计信息失真会计监管体系政府监管

深度破解社会主义时期党的纯洁性建设研究难题

2014年5月18日，由中国浦东干部学院中国特色社会主义研究院（基地）和国家社会科学基金重大项目“党的纯洁性建设研究”课题组联合举办的“社会主义时期党的纯洁性建设研究”学术

期刊

社会主义时期纯洁性中国浦东干部学院国家社会科学基金中国特色社会主义中国延安干部学院上海社会科学院党史研究室

中国梦视域中的社会管理创新

党的十八大以来,以习近平同志为总书记的新一届党中央提出了中国梦的命题。中国梦的核心和要义是实现社会的公平正义,促进社会和谐,使中国共产党的执政理念和执政价值得到最

期刊

中国梦执政使命社会管理创新China dream governance mission social management innovations.

图书馆网络参考咨询工作

文章认为,图书馆网络参考咨询服务工作依赖于高性能的网络系统,丰富的电子资源和高素质的咨询馆员服务队伍。图书馆应全面推进数字图书馆建设,主动开展图书馆主页服务,电子邮

期刊

网络参考咨询电子邮件馆员素质图书馆

龙游县柑桔新品种——夏红柑销得快

12月4日上午，客商正在浙江省衢州市龙游县模环乡东徐村收购夏红柑，价格为0．84元／kg，比温州蜜柑高1倍多。由于夏红柑管理成本比一般柑桔品种低50％左右，虽然夏红柑的价格只有2007年的

期刊

柑桔品种龙游县新品种收购价格温州蜜柑管理成本衢州市浙江省

基于增强学习的多agent自动协商研究

与本文相关的学术论文