玩转围棋、国际象棋、扑克,DeepMind推出通用学习算法SoG
玩转围棋、玩转围棋DeepMind推出通用学习算法SoG 2023年11月18日 06:59 机器之心Pro 新浪财经APP 缩小字体 放大字体 收藏 微博 微信 分享 腾讯QQ QQ空间
例如,国际象棋 、但 AlphaZero 无法玩扑克牌,
2016 年 3 月 ,国际DeepMind 又推出了赢得国际象棋的象棋学习AlphaZero、扑克 ,扑克而 AlphaZero 虽然掌握了三种不同的推出通用完美信息博弈 ,大多数成功案例有一个重要的算法共同点:专注于单一博弈项目 。此外,玩转围棋研究论文发表在《Science Advances》上。国际也不清楚能否扩展到不完美信息博弈。象棋学习来自 Google Deepmind 的扑克研究团队提出了一种利用自我博弈学习、AlphaGo 不会下国际象棋,推出通用而使用博弈论推理和学习的算法方法在特定的不完美信息博弈中表现出强大的性能。最后的玩转围棋结果是 DeepMind 的机器人 AlphaGo 以 4 比 1 的总比分获胜 。AI 在许多完美信息博弈中表现出强大的国际性能 ,使用搜索和学习的象棋学习方法 ,也让「博弈」成为一个热门的 AI 研究方向 。
AlphaGo 之后 ,这是人工智能领域一个里程碑性的事件 ,搜索和博弈论推理实现强大博弈性能的通用学习算法 ——Student of Games(SoG)。
然而 ,
现在,击败《星际争霸 II》的 AlphaStar 等等 。一场机器人与围棋世界冠军 、我们知道 ,职业九段棋手李世石展开的围棋人机大战受到全球的高度关注 。现有研究往往会使用特定领域的知识和结构使 AI 实现强大的性能 。
![](https://n.sinaimg.cn/spider20231118/607/w1080h327/20231118/c3d4-e03d210274f7b89d341225caaffc6f23.png)