基于增强学习的自动协商研究

被引量 : 0次 | 上传用户:lwz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,电子商务已经走进人们的生活。传统的电子商务模式比较简单,在进行交易时,只是单方面的同意或者拒绝,没有协商过程,所以只能对简单生活场景进行模拟,而在现实生活中,协商能够增进买卖双方的了解,并且能解决一些分歧和冲突。人工智能技术的发展使得对Agent研究越来越成熟,Agent帮人处理事情的能力越来越强,由Agent技术和电子商务结合起来形成的自动协商能够为上述问题提供一些解决思路。目前主流的研究方向是把机器学习的方法用到自动协商中,本文研究的是增强学习算法在协商中的应用。本文首先对电子商务、自动协商理论进行简单介绍,讲述了常见的机器学习方法在自动协商中的应用,然后对传统的算法进行研究,指出其存在的问题,并提出期望还原率进行改进,最后将改进后的算法应用的双边多议题当中去,通过实验对比验证所提改进算法的效果。具体研究工作如下:①首先对传统增强学习算法的参数(时间贴现率,时间信念等等)进行研究,分析了参数取不同值时对协商的影响,指出了在不同的协商情形中如何选择合适的参数。②通过实验发现传统增强学习算法存在妥协过快的缺点,针对这个缺点,本文提出基于期望还原率的增强学习算法对原算法进行改进,并对期望还原率的取值进行了讨论,当期望还原率为1时,就是传统的增强学习算法。③结合对手分类和增强学习算法进行协商。通过研究对手的协商历史,将对手分为不同的类别,每个类别对应着不同的协商态度,对不同协商态度的对手采用不同的信念函数进行协商。④利用双边多议题协商框架,将基于期望还原率的增强学习协商策略应用到双边多议题当中,通过与基于传统增强学习算法协商策略、基于时间的协商策略进行对比,实验表明在协商次数允许的范围内,改进算法能取得效用更高的协商解。
其他文献
作家在文学创造方面有着非常关键因素和能量的影响性是情感。对于文章的好坏的评判标准不光需要华丽的词语更为关键的是需要文化的修养,作家情感的投入就要求有关内涵的修养
采用风险管理学、保险学的理论与方法,对厦门国际马拉松赛风险管理的基本理论与方法进行研究。旨在提高人们的风险意识,对赛事的风险进行准确识别,有效地规避和化解风险,从而
所谓关联词是指一个或几个词在语义上起到与上下句相关联作用的词语,在日常的生活交流中有效准确的使用关联词可以明确的表示各个分句之间的关系,主要用来表达复杂客观事物之
20世纪80年代我国鄱阳湖流域实施造林再造林工程,该区域森林面积大幅增加。大规模植物造林可能极大地影响该区域森林碳库与碳收支的变化。因此,气候变化背景下鄱阳湖流域碳平
本文阐述了吉林省森林经营工作经历的主要阶段及主要做法和取得的主要成果,从认识、措施、资金、体制、制度、人员等6个层面分析了当前森林经营工作面临的主要问题,并针对存
通过对10名普通健康男大学生安静状态下及两种运动负荷后唾液睾酮、唾液皮质醇和RPE(主观体力感觉)表等生理指标的测定,发现:运动后,唾液睾酮水平升高,唾液皮质醇无显著变化但有升
民国时期崂山道教的衰微主要表现在道观与道士数量的减少,义理水平的降低和清规戒律的废弛。究其原因主要在于人们思想的解放,当局道教政策的变迁,兵匪的破坏以及西方教派的
<正>真正的太极拳,每一式都讲求神意气所组成的太极之阴和形体动作所构成的太极之阳的转化和互孕,很符合《内经·素问》的一句话:"阴阳者,当代,中医大夫几乎都习练过24式简化
随着设备状态监测和故障诊断等技术的发展进步,以设备状态评价为依据的状态检修正逐步得到推广和应用。状态检修主要包括设备状态量的监测、设备运行状态的诊断和检修策略的制
放牧对草地植物的直接影响包括动物的采食和践踏。为了探讨冷蒿Artemisia frigida的耐牧性,采用人工机械损伤(轻度、中度和重度)的方式处理盆栽冷蒿地上枝叶,分别测定冷蒿叶片