阿尔法围棋主要工作原理

阿尔法围棋主要工作原理,第1张

alphago 原理 以及阿尔法围棋是什么

1.据Alpha Go团队负责人大卫·席尔瓦(david silva)介绍,AlphaGoZero使用新的强化学习方法使自己成为一名教师。一开始,系统甚至不知道围棋是什么,而是从单个神经网络出发,通过神经网络强大的搜索算法进行自我对弈。

2.随着自我博弈的增加,神经网络逐渐调整,提高对下一步的预测能力,最终赢得博弈。更重要的是,随着训练的深入,Alpha Go团队发现AlphaGoZero也自主发现了游戏规则,想出了新的策略,为围棋这个古老的游戏带来了新的见解。

3.AlphaGo是第一个战胜人类职业围棋选手的人工智能机器人,也是第一个围棋世界冠军。它是由谷歌旗下的戴密斯·哈萨比斯公司领导的团队开发的。它的主要工作原理是“深度学习”。

欢迎分享,转载请注明来源:聚客百科

原文地址: http://juke.outofmemory.cn/life/868463.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-07-24
下一篇 2022-07-24

发表评论

登录后才能评论

评论列表(0条)

保存