论文部分内容阅读
多Agent协商是分布式人工智能的主要研究领域之一,在电子商务中有重要的应用。随着Internet的不断发展和成熟,企业的电子化、虚拟化的趋势不断加强,尤其是网上电子交易更加引人注意。为能充分利用Internet的网络资源优势,电子交易领域的问题也日渐突出,比如交易的精度低、效率低和交易者的智能性不足等。分布式人工智能协商技术为这些问题的解决提供了一条途径。协商是一个动态复杂的过程,尤其是面对复杂的协商,解决上述问题不是一件易事。自从Zeng[5]提出基于Bayes学习的协商模型,并指出学习可以促进协商以来,协商和机器学习结合起来成了新的研究热点,提高协商者在协商过程中的学习能力是解决上述问题的有效途径。本文针对协商中存在的问题,在对当前机器学习方法和协商技术进行深入细致的分析,并对它们各自的特点及优缺点有了充分认识的基础上,对协商过程中的一些关键问题进行了研究。主要的研究内容有: 1.对推测计算进行了扩充,并提出了基于信念修正的推测计算。在计算过程中,如果应答和信念不一致,则主agent将修正它的信念。为了实现目标,在有限时间内,使推测计算的结果更精确,主agent要通过协商获得尽可能多的实际信息,协商是降低决策风险的主要途径。为此,提出了基于时间约束的推测计算扩展框架、基于时间约束的进一步协商框架和基于信念修正的协商算法,并将进一步协商框架和协商算法嵌入到推测计算的过程中,在协商过程中赋予主agent更强的信念修正能力。最后,在货物运输领域的实验证实了基于信念修正的推测计算的有效性。
2.为了提高多问题协商的准确性和购物agent的效用,除了考虑协商过程之外,还要解决协商前销售agent的选择问题。为了充分学习协商历史,实现探索(Exploration)和利用(Exploitation)的折衷,把销售者的选择问题转变成K臂赌博机问题(K-armedbanditproblem)来求解。文中提出了信任和声誉的度量模型,结合K臂赌博机问题的求解技术,采用基于模拟协商(N(si))的学习机制,提出了几个确定奖励分布的改进算法H(a,n)、E(a,r)、EE(a,r)和DS,最后,以模拟协商过程为基础将改进算法和信任及声誉模型有机地结合起来,提高了选择销售agent的准确性和实用性。几个实验都证实了本文工作的有效性。
3.提出了一个以理性agent为基础的基于多阶段的多问题协商框架。该框架在时间约束下适用于信息不完全的场景,它描述了多问题的价格协商。为了降低多问题协商的复杂性,它将多问题协商分解为多阶段协商,每个阶段的大小(问题数)相同。阶段数和顺序在协商前确定,每个阶段中的问题顺序在协商中确定。在阶段大小相同的情况下,对给定协商问题的分解,框架能给出优化协商议程(Agenda),提出以仲裁agent为基础的多阶段协商协议,给出了确定多阶段的过程。尤其是,框架能为参与协商的agent建立学习系统(LS),以增强agent的学习能力。最后基于这个框架的原型系统证实这个框架是有效的。
4.提出一个基于推测计算的一对多并行协商模型。在多agent环境中,推测计算就是一个agent在还没有得到应答的情况下提前做出决策的过程。这部分将推测计算用于多个有偿资源获取的一对多协商中。首先将推测计算模型扩充为可容纳多协商线程的模型,并提出具有信念修正的多问题协商模型。基于这两个模型又提出了多线程并行协商过程。为实现这个多线程并行协商过程,给出两种并行方案,并对这两种方案和相应的并行策略进行了讨论。最后通过实验证实了所给出的模型和并行协商过程是有效的。
5.协商双方用动态影响图(DynamicInfluenceDiagram-DID)序列作为协商双方agent的信念机构,提出固定时间区间的不同时刻的多DID综合推理机制。改进VotingEM算法为NE-VotingEM(S,yT)算法。基于NE-VotingEM(S,yT)算法的协商过程适应于指定时间区间不同时刻网络参数的在线学习,还具有考虑不同时刻多网络相关性、确保已有信念的一定延迟等特点。NE-VotingEM(S,yT)算法不仅具有VotingEM的优点,而且在自适应学习率变化方面更精确。提出DID序列更新过程Revision_ID(Ⅴ),并将NE-VotingEM(S,yT)算法嵌入到Revision_ID(Ⅴ)过程中。实验证实基于该算法,通过对多DID的综合推理,可以提高对对方私有信息的预测精度,缩短协商线程,提高协商效率。