从AlphaGo Zero到OpenAI Five

上一篇 / 下一篇  2018-07-04 16:31:49 / 个人分类:博为峰原创技术文章

这两天一个比较热门的话题就是OpenAI625日宣布其研发的人工智能OpenAI Five受限条件Dota2 5V5团战能够战胜人类。从去年1019DeepMind发布AlphaGo Zero,经过短短的半年多时间,人工智能已经从单打独斗的围棋游戏跨越到需要团队协作、战术安排的Dota游戏,人工智能技术的发展开始加速。

AlphaGo Zero使用了64GPU工作站(每一个都有多个GPU)和19CPU参数服务器(每一个都有多个CPU)进行训练,使用4TPU进行比赛时的执行。OpenAI Five使用了128000CPU256GPU。通过算力的提升,一些看似比较复杂的团队协作问题,也可以使用相对简单的算法模型来处理,这给人工智能技术的使用带来了新的启示。

AlphaGo ZeroOpenAI Five纯自我对弈训练,不需要提前注入人的经验,通过持续大量的训练来提升。AlphaGo Zero每天一百万盘对弈,OpenAI Five每天模拟玩180年的游戏。看来人的所谓经验对于人工智能来讲并没有多大的价值,人工智能完全可以靠算力和时间,从零开始、自学成才。

AlphaGo ZeroOpenAI Five都采用了强化学习算法,AlphaGo Zero主要利用蒙特卡洛搜索和深度神经网络,而OpenAI Five则主要利用LSTM网络,每个LSTM网络包含1024个神经元。LSTM网络是一种循环神经网络,能够“记住”任意时间段内的数据信息。从两者的表现来看,在特定领域,神经网络算法已经能达到很好的效果了。

无论是AlphaGo Zero还是OpenAI Five,都只是在游戏领域实现了人工智能对人类智能的逼近和超越,但其所使用到的各种人工智能技术,则可以被借鉴到更多的领域去,帮助人类利用好人工智能,让人工智能更好的为人类服务。也许人工智能的发展比大多数人想象的都要快,真正意义上完全的人工智能也许并没有那么遥远。


TAG:

 

评分:0

我来说两句

日历

« 2024-04-16  
 123456
78910111213
14151617181920
21222324252627
282930    

数据统计

  • 访问量: 33789
  • 日志数: 43
  • 建立时间: 2018-01-25
  • 更新时间: 2018-11-09

RSS订阅

Open Toolbar