微软麻将AI论文发布首次公开技术细节

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:castchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2019年8月,微软公司曾推出一个名为Suphx的麻将人工智能系统,并在麻将游戏社区Tenhou中对其进行测试。据悉,Tenhou是世界上最大的麻将社区之一,拥有超过35万活跃用户。根据测试结果,Suphx最高成绩为10段。这是目前为止,世界上第一个也是唯一一个达到10段水平的人工智能。
  近日,微软团队发布了一份修订版预印本文件,对Suphx进行了全面介绍。目前,这项研究发表在学术网站上,论文题目为《Suphx:用深度强化学习打麻将(Suphx:Mastering Mahjong with Deep Reinforcement Learning)》。
  研究人員选择用日本4人麻将(Riichi Mahjong)规则训练Suphx模型,训练数据来自Tenhou社区。培训过程耗时两天,研究人员在44个图形处理单元上、用150万个游戏对模型进行了训练。Suphx学习了5种模式来处理不同的情况,分别是弃牌(discard)模式、Riichi模式、Chow模式、Pong模式和Kong模式。所有模式都用网络结构表示。弃牌模式对应34张牌,有34个输出神经元。其他模式仅有两个输出神经元,分别对应执行或不执行操作。
  除上述设定外,研究团队还引入了其他几种技术:一是全局奖励预测器(GRU网络)。该预测器可以提前预测游戏的最终结局,提供有效的学习信号,从而使策略网络可执行。二是Oracle代理。相比标准的深度学习过程,利用Oracle代理进行训练可加速模型的学习过程。三是参数化的蒙特卡罗策略自适应算法(pMCPA)。pMCPA会不断调整离线学习策略,使其能适应突发的游戏情节(比如4个玩家丢弃了公共牌)。
其他文献
本报讯 近日,交易平台BW.com与比特币P2P交易平台PAXFUL签署了战略合作协议,共同发展数字货币全球场外交易市场。 全球的供需双方可在BW.com平台进行场外交易,可使用美元、欧元等30多种货币,通过PayPal、Visa/Master card等超350種的支付方式来购买比特币。
本报讯 日前,菜鸟宣布国内首个无人车未来园区在成都启用,这是菜鸟无人车首次从末端配送,进入园区调拨运输环节。菜鸟介绍,每辆车一次可搭载数百个天猫消费者的包裹。行车过程中,菜鸟无人车能感知周边环境,自主进行决策,可以对行人、车辆等各类动态、靜态障碍物进行避让,也可以调度园区内的红绿灯,对社会车辆发出提醒。
本报讯 近日,AI视频面试SaaS服务商近屿智能完成数千万元Pre-A轮融资,本轮融资由英诺天使领投,上一轮投资方金沙江创投继续跟投。近屿智能CEO方小雷表示,本輪融资将主要用于AI算法、产品细节的打磨以及销售拓展。
近日,领克汽车公布了旗下车型领克05的动力配置。领克05的官方百公里加速时间为6.7秒,百公里制动距离仅35米,并搭载自赛车调校技术的底盘、博格华纳第五代智能四驱系统等装备。  據悉,领克05搭载了爱信8速手自一体变速箱。该变速箱专为领克05的横置发动机而设计,重量仅为96kg,能有效减少车身前部重量负荷,提升整车的车辆操控性。同时,领克05还采用了前麦佛逊式独立前悬架与多连杆式后悬架的结构,高强
近年来自动驾驶技术发展迅猛,不过要实现大规模收益,还有很长的路要走。  德国汽车技术公司大陆集团CEO德根哈特(ElmarDegenhart)日前在接受采访时表示,L4级别自动驾驶的市场商业化发展需要时间。德根哈特说道:“到2030年前,预计自动驾驶市场的发展仍然主要依靠辅助系统驱动,人们将借助各种辅助的传感器,来提高驾驶的安全。对辅助驾驶方面的需求会促进细分市场的发展。”  德根哈特预计,203
摊面糊、打鸡蛋、刷酱、打包,不出两分钟,高师傅便做出一份可口的煎饼果子。   助手接過煎饼果子,扫一眼屏幕,抬手放进相应编号的保温柜。不到一分钟,从地铁站出来的李先生,拿起手机一扫,柜门弹开,取走早餐。   人流涌动,脚步匆匆,开柜门、取餐、合上……砰砰声不断。   这里是“盒小马”上海首店,开在上海黄浦区一家商场B2层——地铁13号线世博会博物馆站出站口,由早餐档口与保温自动取货柜组成,现
本报讯 近日,智能毫米波传感器公司矽典微宣布完成新一轮千万元规模融资。据悉,本轮融资将用于高端人才引进、研发投入、开拓市场以及支持产品量产运营,加速毫米波系統芯片技术在智能设备上的应用普及,同时持续加强团队在技术、产品研发上建起的壁垒。
近日,据国外媒体报道,雷克萨斯总裁佐藤浩二(Koji Sato)在欧洲的新闻发布会上表示,雷克萨斯今年将推出一款具备L2级自动驾驶能力的汽车。  新车将支持自动变道,还支持OTA更新,通过更新,车辆有可能会达到L3级自动驾驶。  据介绍,L2级自动驾驶一般会搭载ACC自适应巡航系统、车道保持系统、自动刹车辅助系统、交通拥堵辅助系统、自动泊车系统等。  佐藤浩二没有透露该套系统会最先搭载在哪款车型上
本报讯 3月16日,AMD在北京召开以“锐不可挡”为主题的AMD创新技术峰会。继3月2日锐龙AMD Ryzen 7系列处理器华丽登场,并获得了消费者和媒体的广泛好评之后,AMD再接再厉,在本次创新技术峰会上公布了多款产品的最新信息,其中最引人注目的莫过于AMD正式宣布了面向主流消费者的锐龙 AMD Ryzen 5系列处理器产品的价格和上市日期,以及架構为Vega的下一代GPU的相关细节。发布会上,
据国外媒体Teslarati报道,特斯拉近期将向自动驾驶软件的测试用户推送新版自动驾驶软件。在这一版本软件中,特斯拉识别红绿燈的功能得到提升。比如,如果前方是绿灯,车辆可以不经驾驶员确认主动通过。据介绍,特斯拉的车身四周共有8枚摄像头,其中3枚正对车辆前进方向。这三枚摄像头为长焦、广角和超广角,分别用来探测远距离窄视角、中等距离中等视角和近距离广视角的视觉图像。三枚摄像头相互配合,可实时收集外界的