基于TD强化学习智能博弈程序的设计与实现

来源 :计算机应用 | 被引量 : 19次 | 上传用户:chunxi1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探讨了基于TD (TemporalDifference)预测强化学习智能博弈程序的设计原理 ,并基于该原理结合BP神经网络设计并实现了一个能自学习的五子棋博弈程序。实验证明 ,该方法既能避免设计复杂的静态评估函数 ,又能很好地解决传统的智能博弈程序中存储空间大和运行速度慢等问题 ,同时克服了传统方法难以在模糊、不完整或冗余 ,甚至矛盾的数据基础上进行问题求解的缺点。
其他文献
本文主要分析运行于Windows环境的PowerBuilder4.x与运行于服务器上的Oracle7.x的连接和通信技术,讨论如何针对其特点,优化信息系统开发环境,实现一个高效的客户/服务器系统。
目的比较分析MINE与ICE方案治疗复发难治性淋巴瘤的临床疗效及安全性。方法对56例复发难治性非霍奇金淋巴瘤(NHL)患者,分别采用MINE与ICE 2种不同的方案化疗,每组各28例。比较2
农民进城是中国城镇化发展的必然产物。农民市民化的进度,不以人们的意志为转移,是由当地经济社会发展的综合因素决定的。但是,农民市民化过程中遇到的文化价值观、市民生活方式
文中对媒体设备连接网络协议MOST进行了综述 ,较详细地介绍了MOST的功能特点、MOST网络的基本结构、MOST设备、MOST信息帧结构以及MOST发送接收器等内容 ,对MOST的发展和应用进行了讨论
目的探讨妊娠性绒癌肾转移的临床表现、诊断及治疗。方法回顾性分析1例以血尿为首发症状的妊娠性绒癌的临床资料。结果化疗前血β-HCG水平〉10 000 IU/L,化疗后血β-HCG水平
软件版权的保护愈来愈重要,利用磁道接缝加密来实现对软件版权的是保护一种行之有效的软件加密方法,本文讨论了磁道接缝加密技术中存在的问题,给出了解决的办法。
NETWARE数据报网际分组交换协议的应用夏益青东南大学动力工程系(210018)1概述NOVELL公司的NETWARE是目前国内最流行的局域网操作系统,它较好地处理了多任务并发和开放性协议技术,并以其通用性、可靠性、开放性、互连性及多级容错和安全保...
本文给出了一个强连通子图的排序算法,证明了算法的正确性。其算法的时间复杂度为O(m~2)。该算法将一般排序方法引入到图论中,使难于实现的图排序简化为整数排序。
目的探讨新辅助化疗后乳腺癌前哨淋巴结活检的可行性。方法对57例行^99Tc联合亚甲蓝示踪前哨淋巴结活检术和腋窝淋巴结清扫术乳腺癌患者的资料进行分析,其中31例ⅡB、Ⅲ期患者
本文介绍了一种用计算机图形显示实现飞行模拟器仪表的方法,并给出在PC286微机上运行的子程序。