基于学习和推测计算的多Agent协商机制研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zcllq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多Agent协商是分布式人工智能的主要研究领域之一,在电子商务中有重要的应用。随着Internet的不断发展和成熟,企业的电子化、虚拟化的趋势不断加强,尤其是网上电子交易更加引人注意。为能充分利用Internet的网络资源优势,电子交易领域的问题也日渐突出,比如交易的精度低、效率低和交易者的智能性不足等。分布式人工智能协商技术为这些问题的解决提供了一条途径。协商是一个动态复杂的过程,尤其是面对复杂的协商,解决上述问题不是一件易事。自从Zeng[5]提出基于Bayes学习的协商模型,并指出学习可以促进协商以来,协商和机器学习结合起来成了新的研究热点,提高协商者在协商过程中的学习能力是解决上述问题的有效途径。本文针对协商中存在的问题,在对当前机器学习方法和协商技术进行深入细致的分析,并对它们各自的特点及优缺点有了充分认识的基础上,对协商过程中的一些关键问题进行了研究。主要的研究内容有: 1.对推测计算进行了扩充,并提出了基于信念修正的推测计算。在计算过程中,如果应答和信念不一致,则主agent将修正它的信念。为了实现目标,在有限时间内,使推测计算的结果更精确,主agent要通过协商获得尽可能多的实际信息,协商是降低决策风险的主要途径。为此,提出了基于时间约束的推测计算扩展框架、基于时间约束的进一步协商框架和基于信念修正的协商算法,并将进一步协商框架和协商算法嵌入到推测计算的过程中,在协商过程中赋予主agent更强的信念修正能力。最后,在货物运输领域的实验证实了基于信念修正的推测计算的有效性。 2.为了提高多问题协商的准确性和购物agent的效用,除了考虑协商过程之外,还要解决协商前销售agent的选择问题。为了充分学习协商历史,实现探索(Exploration)和利用(Exploitation)的折衷,把销售者的选择问题转变成K臂赌博机问题(K-armedbanditproblem)来求解。文中提出了信任和声誉的度量模型,结合K臂赌博机问题的求解技术,采用基于模拟协商(N(si))的学习机制,提出了几个确定奖励分布的改进算法H(a,n)、E(a,r)、EE(a,r)和DS,最后,以模拟协商过程为基础将改进算法和信任及声誉模型有机地结合起来,提高了选择销售agent的准确性和实用性。几个实验都证实了本文工作的有效性。 3.提出了一个以理性agent为基础的基于多阶段的多问题协商框架。该框架在时间约束下适用于信息不完全的场景,它描述了多问题的价格协商。为了降低多问题协商的复杂性,它将多问题协商分解为多阶段协商,每个阶段的大小(问题数)相同。阶段数和顺序在协商前确定,每个阶段中的问题顺序在协商中确定。在阶段大小相同的情况下,对给定协商问题的分解,框架能给出优化协商议程(Agenda),提出以仲裁agent为基础的多阶段协商协议,给出了确定多阶段的过程。尤其是,框架能为参与协商的agent建立学习系统(LS),以增强agent的学习能力。最后基于这个框架的原型系统证实这个框架是有效的。 4.提出一个基于推测计算的一对多并行协商模型。在多agent环境中,推测计算就是一个agent在还没有得到应答的情况下提前做出决策的过程。这部分将推测计算用于多个有偿资源获取的一对多协商中。首先将推测计算模型扩充为可容纳多协商线程的模型,并提出具有信念修正的多问题协商模型。基于这两个模型又提出了多线程并行协商过程。为实现这个多线程并行协商过程,给出两种并行方案,并对这两种方案和相应的并行策略进行了讨论。最后通过实验证实了所给出的模型和并行协商过程是有效的。 5.协商双方用动态影响图(DynamicInfluenceDiagram-DID)序列作为协商双方agent的信念机构,提出固定时间区间的不同时刻的多DID综合推理机制。改进VotingEM算法为NE-VotingEM(S,yT)算法。基于NE-VotingEM(S,yT)算法的协商过程适应于指定时间区间不同时刻网络参数的在线学习,还具有考虑不同时刻多网络相关性、确保已有信念的一定延迟等特点。NE-VotingEM(S,yT)算法不仅具有VotingEM的优点,而且在自适应学习率变化方面更精确。提出DID序列更新过程Revision_ID(Ⅴ),并将NE-VotingEM(S,yT)算法嵌入到Revision_ID(Ⅴ)过程中。实验证实基于该算法,通过对多DID的综合推理,可以提高对对方私有信息的预测精度,缩短协商线程,提高协商效率。
其他文献
随着多媒体技术的迅速发展及其应用领域的不断拓广,视频压缩编码技术的重要性不断凸显,对视频压缩编码算法及其标准的研究具有极其重要的意义。同时,随着现场可编程门阵列FPGA(Fi
在数据广播环境下位图索引有着一些特有的优势:与数据广播的调度算法无关;符合数据广播环境的只读特点;查询速度快。而当前很多索引方法都对数据广播的调度算法提出了要求和限制
在过去的十年中,以缓冲区溢出为代表的安全漏洞是最为常见的一冲形式,也是主要威胁计算机系统安全的攻击手段。更为严重的是,缓冲区溢出漏洞占了远程网络攻击的绝大多数,这种攻击
经过多年的发展,Web应用已经成为当前的主流网络应用形式之一,且Web应用的复杂性急剧上升,对性能的要求也越来越高。例如一些电子商务网站等对性能要求较高的系统,性能低下会
本体(Ontology)原本是一个哲学概念,后来计算机工作者将本体概念应用到计算机领域,并赋予其崭新的意义.在计算机科学中,本体是领域概念模型的显式表示.它能很好地表达对象之
随着网络技术在电子商务、金融、政府及军事领域应用的深入发展,网络信息交换的安全问题已经引起了业界的高度重视。为了保证信息交换的安全性,人们在信息安全领域做了大量的
随着互联网的发展与应用,网络安全问题日益严重。入侵检测技术是网络安全领域内一门正在发展中的新技术,而随着应用的普及,对入侵检测系统的评估研究也变得越来越重要。
本文对 GIS 和 CRM 技术的发展,特别是在电力行业的应用进行了探讨和论述。作为电力企业提高竞争能力的重要手段,CRM 逐渐受到电力企业的关注。基于 GIS 的分析和表现技术在 CRM 系统中发挥着重要的作用。 文章以西藏东部电网 CRM 系统为基础,详细探讨了西藏东部电网的电网构架、系统网络地图、营销属性数据、市场调查数据,分析了将地理信息技术运用到 CRM 系统的关键技术和难点,加强了 C
随着Internet的不断发展,传统的基于二层结构的数据库访问系统的问题越来越明显,三层结构体系已经成为业界主流技术。J2EE(Java 2 Platform Enterprise Edition)就是在这种情
移动资源演算(MR)是一种用于描述携带资源的移动系统及其交互的形式化方法,它隶属于灰箱演算的一支。灰箱演算由Cardelli提出,最初被称为移动灰箱演算(MA),本文将绝大部分由灰箱