【摘 要】
:
计算机棋类游戏的研究目标是人工智能选手的智力提高,而学习样例对棋局局面的代表性,在很大程度上决定了选手的智力水平,但学习样例的产生方式和优劣判定一直未能引起足够重
【机 构】
:
郑州大学 信息工程学院,郑州450001;郑州大学 信息工程学院,郑州450001;郑州大学 产业技术研究所第四代工业研究所,郑州450001
论文部分内容阅读
计算机棋类游戏的研究目标是人工智能选手的智力提高,而学习样例对棋局局面的代表性,在很大程度上决定了选手的智力水平,但学习样例的产生方式和优劣判定一直未能引起足够重视.针对自对弈棋局样例产生中的选手筛选问题,本文提出了一种将体育赛制(混合赛制、循环赛制、淘汰赛制)和遗传算法结合的学习样例生成算法,来规范选手筛选过程并从而提高高质量样例的产生效率.该算法引入成熟公正的体育赛制组织形式为人工智能选手匹配和淘汰对手,将优胜者之间的对局做为学习样例,并使用遗传变异方法使选手逐代进化.在西洋跳棋上的实验结果表明,本文提出的样例生成算法可以有效产生样例;在样本规模综合指标T的评价下,混合赛制和循环赛制产生的学习样例具有更高质量;基于样例训练的选手能力对比表明,循环赛制最适合于西洋跳棋游戏的样例产生.
其他文献
当前在线学习社区学习者的情感识别多是采用有监督机器学习方法,其需要使用大量有标记数据对分类模型进行训练,这将会耗费大量的时间和人力成本,从而大幅提升了情感识别的成
现有的知识图推荐模型通过聚合相邻实体节点的特征和结构信息来更新当前位置实体节点的嵌入表示,为了控制计算成本和维护模型的稳定性,通常使用随机的固定大小的采样邻域来替
如今,基于云计算的软件服务对自适应资源分配提出要求,这种分配可以根据需要动态调整资源,以保证良好的服务质量(QoS,Quality of Service)和低成本资源.然而,在复杂波动的负
针对同时存在全局与局部环境的移动机器人路径规划问题,提出了一种分层路径规划方法.采用改进势场-蚁群融合算法进行规划.首先,在全局环境下采用改进蚁群算法进行路径规划,为
针对考虑运输时间的柔性作业车间调度问题,构建了以最大完工时间最小化、最大机器负载最小化和总机器负载最小化为目标的多目标优化模型,并提出一种小生境粒子群优化算法求解
针对现有室内场景识别方法仅通过关注视觉信息本身,而缺乏考虑图像中所含语义内容,提出一种基于长短期记忆神经网络和卷积神经网络的融合深度神经网络室内场景识别方法.首先使用labelImg工具为Visual Genome数据集图像生成位置描述符,经数据预处理算法处理后通过GloVe模型得到词向量.然后引入带有L2正则化的小批量梯度下降算法训练模型,将注意力机制与融合深度神经网络模型结合实现对位置描述符进
邻居选择和邻居数量对于推荐系统评分预测具有关键作用.本文采用复杂网络模型中多种聚类方法,针对现有方法通常基于单一相似性选择邻居的问题,建立用户为节点,相似性与置信系
面对网络学习资源的信息过载问题,如何根据用户的偏好推荐其感兴趣的学习资源是网络教育智能化的关键应用.协同过滤推荐算法无需构建资源的特征描述,经常应用于形式多样的网
基于卷积神经网络的目标检测在智能机器人、无人机等领域有着重要的应用,但其模型普遍结构复杂、参数量大、占用资源多,难以满足嵌入式目标检测任务中的实时性需求.针对此问题,本文提出一种多尺度特征融合注意力网络(MSFAN:Multi-Scale Feature-fusion Attention Network)模型,该模型基于MobileNet_YOLOv3网络模型,并结合多尺度特征融合等改进措施,在高
深度学习在控制图模式识别的运用上,易受控制图样本量和控制图质量特征数据点数的影响,针对这个问题,本文提出基于感知器-卷积神经网络的孪生神经网络(Perceptron-Convolutio