多代理模糊收益及策略学习

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jh_viso1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了基于模糊知识的多代理决策问题.通过建立代理决策目标的模糊知识,我们给出了基于模糊收益的多代理决策模型,并研究了基于梯度的代理策略学习算法.
其他文献
随着Ad Hoc网络研究的深入,安全问题已引起广泛的关注.Ad Hoc网络由于其传输媒介开放、网络拓扑变化快、带宽资源有限、节点间仅靠合作而缺乏集中监控点等特性,容易遭受攻击.
通过对ILAS5.0的使用和实践,介绍作者摸索总结的一些经验和应用技巧。
本文讨论了在网络环境下,如何开拓外文书阅览室的读者服务工作。
针对图书馆咨询工作发展的需求,提出了电话咨询,重点咨询,网络咨询,“镜像”咨询,聘专家咨询等方式方法,力求为用户提供更快,更全,更深,更准的信息服务。
缓存失效报告法是在移动计算环境中普遍采用的缓存方案,即服务器定期广播缓存失效报告,该报告中包含了最近被更新的对象,根据报告内容,客户可使缓存中被更新对象失效,以保证
展望了图书馆由传统向现代化互联网方式的转变前景,讨论了参考咨询工作现代化问题以及当前应采取的措施。
详细客观地分析了《中图法》在类目设置中的不足,提出了两种解决办法。
由于移动计算环境的固有特性、数据访问者的移动性、事务的截止期限制等,传统平坦事务模型无法满足移动实时数据库的需求.本文针对移动实时数据库事务的特点,提出了一种分片