从AlphaGo Zero到OpenAI Five

发表于:2018-7-04 13:20

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:51Testing软件测试网    来源:本站原创

分享:
  这两天一个比较热门的话题,就是OpenAI在6月25日宣布其研发的人工智能OpenAI Five,在受限条件下,Dota2 5V5团战能够战胜人类。从去年10月19日DeepMind发布AlphaGo Zero,经过短短的半年多时间,人工智能已经从单打独斗的围棋游戏跨越到需要团队协作、战术安排的Dota游戏,人工智能技术的发展开始加速。
    
  AlphaGo Zero使用了64个GPU工作站(每一个都有多个GPU)和19个CPU参数服务器(每一个都有多个CPU)进行训练,并使用4个TPU进行比赛时的执行。OpenAI Five使用了128000个CPU和256个GPU。通过算力的提升,一些看似比较复杂的团队协作问题,也可以使用相对简单的算法模型来处理,这给人工智能技术的使用带来了新的启示。
  AlphaGo Zero和OpenAI Five都是采用纯自我对弈训练,不需要提前注入人的经验,通过持续大量的训练来提升。AlphaGo Zero每天一百万盘对弈,OpenAI Five每天模拟玩180年的游戏。看来人的所谓经验对于人工智能来讲并没有多大的价值,人工智能完全可以靠算力和时间,从零开始、自学成才。
  AlphaGo Zero和OpenAI Five都采用了强化学习算法,AlphaGo Zero主要利用蒙特卡洛搜索和深度神经网络,而OpenAI Five则主要利用LSTM网络,每个LSTM网络包含1024个神经元。LSTM网络是一种循环神经网络,能够“记住”任意时间段内的数据信息。从两者的表现来看,在特定领域,神经网络算法已经能达到很好的效果了。
  无论是AlphaGo Zero还是OpenAI Five,都只是在游戏领域实现了人工智能对人类智能的逼近和超越,但其所使用到的各种人工智能技术,则可以被借鉴到更多的领域去,帮助人类利用好人工智能,让人工智能更好的为人类服务。也许人工智能的发展比大多数人想象的都要快,真正意义上完全的人工智能也许并没有那么遥远。

上文内容不用于商业目的,如涉及知识产权问题,请权利人联系博为峰小编(021-64471599-8017),我们将立即处理。
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号