基于增强学习的代理谈判模型

来源 :计算机工程 | 被引量 : 0次 | 上传用户:airbter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时间贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。
其他文献
提出了一种多层关联推荐算法,结合商品目录,自动快速选择最佳的匹配粒度, 进行基于频繁集的在线推荐。实验结果表明,算法大大提高了在线匹配的性能和质量,可成 功应用到电子商务的
<正>二十一世纪的第一个十年,信息产业方兴未艾,各种新旧媒体所承载的各种各样的庞杂的信息充斥在我们身边的每一个角落。电视媒体的蓬勃发展使得我们从原来的几个台、十几个
以“艰苦奋斗、顾全大局、自强不息、勇于创新”为基本内涵的吕梁精神是吕梁人民宝贵的精神财富,她植根于历史悠久的中华民族文化,熔铸于中华民族革命战争,玉成于中国特色社会主
报纸
为使税收政策能在新时期得到进一步完善,我国于2011年正式推出了营改增试点改革,随着新政策的稳步开展,房地产行业也加入到新政策改革的行列中。营改增实施的初衷是为了避免
“切萨雷·贝卡里亚到底是功利论者 ,还是报应论者 ?”虽然是个老话题 ,但在我国对此问题的回答仍是争论不休 ,文章从刑罚权的起源 ,刑罚权的行使、刑罚的目的三个方面 ,即贝
编者按:高卫东书记在市委三届二次全体(扩大)会议的讲话中指出:在战火硝烟、艰苦岁月铸就的吕梁精神充分彰显了吕梁人民艰苦奋斗、顾全大局、自强不息、勇于创新的可贵品质。吕梁
报纸
企业集团通常是由多个法人企业联合而成的经济联合实体,企业集团经营都是以经济利益为其根本目标,税收是集团企业在支出成本中的重要组成部分,纳税更是企业集团应尽的责任和
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间和空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于重叠区的3阶段改进算法,
今春上演的《早春二月》是上海歌剧院继舞剧《周璇》《奔月》之后,打造的又一部原创舞剧。多年沉寂之后,舞剧团华丽转身。也正因多年积蓄之后的爆发,上海歌剧院选择以现代舞
“五四”一代学者极力推崇安徒生童话,使之成为中国现代儿童文学最初的理想样本,安徒生童话所产生的广泛的影响力与郑振铎的大力宣扬密切相关,郑振铎对安徒生童话的艺术特质