空间管理您的位置: 51Testing软件测试网 » 博为峰软件的个人空间 » 日志

从AlphaGo Zero到OpenAI Five

上一篇 / 下一篇 2018-07-04 16:31:49 / 个人分类：博为峰原创技术文章

这两天一个比较热门的话题，就是OpenAI在6月25日宣布其研发的人工智能OpenAI Five，在受限条件下，Dota2 5V5团战能够战胜人类。从去年10月19日DeepMind发布AlphaGo Zero，经过短短的半年多时间，人工智能已经从单打独斗的围棋游戏跨越到需要团队协作、战术安排的Dota游戏，人工智能技术的发展开始加速。

AlphaGo Zero使用了64个GPU工作站（每一个都有多个GPU）和19个CPU参数服务器（每一个都有多个CPU）进行训练，并使用4个TPU进行比赛时的执行。OpenAI Five使用了128000个CPU和256个GPU。通过算力的提升，一些看似比较复杂的团队协作问题，也可以使用相对简单的算法模型来处理，这给人工智能技术的使用带来了新的启示。

AlphaGo Zero和OpenAI Five都是采用纯自我对弈训练，不需要提前注入人的经验，通过持续大量的训练来提升。AlphaGo Zero每天一百万盘对弈，OpenAI Five每天模拟玩180年的游戏。看来人的所谓经验对于人工智能来讲并没有多大的价值，人工智能完全可以靠算力和时间，从零开始、自学成才。

AlphaGo Zero和OpenAI Five都采用了强化学习算法，AlphaGo Zero主要利用蒙特卡洛搜索和深度神经网络，而OpenAI Five则主要利用LSTM网络，每个LSTM网络包含1024个神经元。LSTM网络是一种循环神经网络，能够“记住”任意时间段内的数据信息。从两者的表现来看，在特定领域，神经网络算法已经能达到很好的效果了。

无论是AlphaGo Zero还是OpenAI Five，都只是在游戏领域实现了人工智能对人类智能的逼近和超越，但其所使用到的各种人工智能技术，则可以被借鉴到更多的领域去，帮助人类利用好人工智能，让人工智能更好的为人类服务。也许人工智能的发展比大多数人想象的都要快，真正意义上完全的人工智能也许并没有那么遥远。

收藏举报

TAG:

查看全部评论

从AlphaGo Zero到OpenAI Five

用户菜单

我的栏目

标题搜索

日历

我的存档

数据统计

RSS订阅