这两天一个比较热门的话题,就是OpenAI在6月25日宣布其研发的人工智能OpenAI Five,在受限条件下,Dota2 5V5团战能够战胜人类。从去年10月19日DeepMind发布AlphaGo Zero,经过短短的半年多时间,人工智能已经从单打独斗的围棋游戏跨越到需要团队协作、战术安排的Dota游戏,人工智能技术的发展开始加速。
AlphaGo Zero使用了64个GPU工作站(每一个都有多个GPU)和19个CPU参数服务器(每一个都有多个CPU)进行训练,并使用4个TPU进行比赛时的执行。OpenAI Five使用了128000个CPU和256个GPU。通过算力的提升,一些看似比较复杂的团队协作问题,也可以使用相对简单的算法模型来处理,这给人工智能技术的使用带来了新的启示。
AlphaGo Zero和OpenAI Five都是采用纯自我对弈训练,不需要提前注入人的经验,通过持续大量的训练来提升。AlphaGo Zero每天一百万盘对弈,OpenAI Five每天模拟玩180年的游戏。看来人的所谓经验对于人工智能来讲并没有多大的价值,人工智能完全可以靠算力和时间,从零开始、自学成才。
AlphaGo Zero和OpenAI Five都采用了强化学习算法,AlphaGo Zero主要利用蒙特卡洛搜索和深度神经网络,而OpenAI Five则主要利用LSTM网络,每个LSTM网络包含1024个神经元。LSTM网络是一种循环神经网络,能够“记住”任意时间段内的数据信息。从两者的表现来看,在特定领域,神经网络算法已经能达到很好的效果了。
无论是AlphaGo Zero还是OpenAI Five,都只是在游戏领域实现了人工智能对人类智能的逼近和超越,但其所使用到的各种人工智能技术,则可以被借鉴到更多的领域去,帮助人类利用好人工智能,让人工智能更好的为人类服务。也许人工智能的发展比大多数人想象的都要快,真正意义上完全的人工智能也许并没有那么遥远。
上文内容不用于商业目的,如涉及知识产权问题,请权利人联系博为峰小编(021-64471599-8017),我们将立即处理。