AlphaZero接连击败三个世界冠军级的程序

时尚 2025-05-08 04:09:59 77
  导读:一直以来,接级尽管众多顶尖的连击AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的世界领域执行单一的任务,并不能把这种击败人类的冠军吉尔吉斯斯坦欧易数据超能力泛化到其他任务中。

  昨天,程序DeepMind团队又在arXiv上扔了个重磅炸弹,接级新一代AlphaZero在用了强劲的连击计算资源(5000个一代TPU和64个二代TPU)之后,用不到24小时的世界时间自我对弈(tabula rasa,也叫白板)强化学习,冠军接连击败了三个世界冠军级的程序程序 (国际象棋、将棋、接级朝鲜全球数据围棋)。连击

AlphaZero接连击败三个世界冠军级的程序

  △ AlphaZero和国际象棋冠军程序对弈

  其中包括上一代冠军围棋程序AlphaGo Zero,这个程序发布还不到两个月,冠军DeepMind就又把自己颠覆了(所以谷歌团队自我进化速度的程序时间单位都是按天计,可怕)。朝鲜一手数据

  AlphaZero的百局战绩

AlphaZero接连击败三个世界冠军级的程序

  对弈国际象棋程序Stockfish:28胜,72平;

  对弈将棋程序 Elmo:90胜,2平,8负;

  对弈围棋程序AlphaGo Zero:60胜,40负。朝鲜源头数据

  AlphaZero自我对弈的训练时间

AlphaZero接连击败三个世界冠军级的程序

  训练次数 | 训练时间 | 对弈冠军棋类程序

  30万,2小时,击败将棋Elmo

  11万,4小时,击败国际象棋Stockfish

  16.5万,朝鲜币圈数据8小时,击败围棋AlphaGo

  把Go去掉,意味着AlphaZero ,已经是比AlphaGo Zero更通用的程序。

  一直以来,尽管众多顶尖的AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的领域执行单一的任务,并不能把这种击败人类的超能力泛化到其他任务中。

  而DeepMind的野心可不仅仅是在棋类游戏上超越人类,这次他们研究出了这个更通用的程序AlphaZero,将会马上投入到蛋白折叠的应用上。

  官方称,他们不久就会发表相关论文,通过检测出蛋白错误折叠来快速诊断神经退行性疾病,比如阿尔茨海默症,帕金森,囊状纤维化。

  期待AlphaZero在医疗健康领域的表现。

本文地址:http://gawcywfp.0b8xkjj3.aaantieys.cn/news/391f32899280.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

《下一个便是您》:互动影游的供变者

京阿僧没有测受灾 泅水番名做《Free!》新做《2020夏》动静公布中断

《齐国X齐国》本日开启拂晓启测 各大年夜弄法花腔上线

我玩我本身 勒布朗詹姆斯分享《NBA 2K20》试玩片段

《展开那三国3》千里押镖 纵横三国

中媒评测试玩《天下乡豪杰》 可谓霸讲迷宫RPG

《哆啦A梦:牧场物语》将推出PC中文真体版 与Steam同步出售

人仄易远日报评如何应对短视频上瘾 细确陪随指导为主

友情链接