对于那些认为人工智能是威胁的(de)人来说,可能不(bú)太喜(xǐ)欢 DeepMind 的最新研究成(chéng)果。这家隶属于 Alphabet 的(de)人工(gōng)智能部门提出了名为 MuZero 的新算(suàn)法,能够让机器在不了解规则的(de)情况下成功击败人(rén)类选手。这(zhè)绝对是人工智能领域的一个惊人发展,因(yīn)为该算法(fǎ)能够(gòu)让人工智能更好地的应对现实生活中的场(chǎng)景,而(ér)且不需要提供(gòng)任何特定的算(suàn)法。
DeepMind 在探索人工智能的(de)道路上从未停止脚步。在 AlphaGo 学会围棋并成功击败(bài)职业围(wéi)棋手之(zhī)后,DeepMind 又推出了 AlphaGo Zero,通过观(guān)察人和人之间(jiān)的真实比赛,然后让两台计算(suàn)机一同来下棋。
随后,该团队再次推出了 AlphaZero,只(zhī)是(shì)在告知游戏规则的情况下,实现了对围棋、将棋(qí)和国际象棋的熟练(liàn)掌握。而(ér)现在该团队推出的 MuZero,并没有告知(zhī)任何的棋类运行(háng)规(guī)则,让它自己(jǐ)通过(guò)观察来掌握围棋、国际象棋(qí)、将棋和 Atari 游戏。
MuZero 在(zài)没有传(chuán)授(shòu)规则的情况下(xià)可(kě)以自己(jǐ)学习,制定相应的计划并取得胜利。MuZero 可以在雅达利游戏中做同样的事情。新的(de)人工(gōng)智能在学习了规则之后,可以(yǐ)变得和以前的版(bǎn)本一样好,甚至(zhì)比以前(qián)的(de)版本(běn)更好。
这个项(xiàng)目的(de)目标是提供(gòng)一个单一(yī)的算(suàn)法(fǎ),可以让AI在不知(zhī)道该方案的规则的情(qíng)况下(xià)想出下一步(bù)行动。对于(yú)象(xiàng)棋和围棋这样的游戏来说,这可(kě)能说起来容(róng)易做起来难,因为(wéi)在(zài)这些游戏(xì)中,有一套预定义的动(dòng)作(zuò)可以让你获得胜利或失败。但在大多数现实世(shì)界(jiè)的(de)情(qíng)况下,如果没有获得复杂的算法,人工智能可(kě)能难以驾驭(yù)更多的种类,而这种算法基本上可以(yǐ)让它思考。
但事实上 MuZero 并不会(huì)自己思考,更没有达到科(kē)幻小说/电(diàn)影中可怕的人(rén)工智能。然(rán)而(ér),DeepMind确实达到了一个重要的里程(chéng)碑,如果它的算法允(yǔn)许(xǔ)计算(suàn)机在(zài)它不知道所有规则的(de)模(mó)拟中提出一(yī)个(gè)胜利(lì)的解决方案。
Engadget解释说,MuZero在做决定时会考虑(lǜ)三件(jiàn)事。首先,它会考虑上一(yī)次行动的结果、当前所处的位置以及下一次(cì)行动(dòng)的最佳方(fāng)案。DeepMind发(fā)现,MuZero与之前的AIs相匹配。而且,它的时间越(yuè)多,它提供(gòng)的解决方(fāng)案就(jiù)越好。即使加(jiā)入了(le)时间限制,比如在行动前限制吃豆人女士的(de)模(mó)拟次数,MuZero也取得了不错的(de)效果(guǒ)。