如何評(píng)價(jià)DeepMind發(fā)表在Nature上的AlphaGo?
今天有兩只GO快要改變世界了,老GO被新GO的智能碾壓,完成了從“快速學(xué)習(xí)”到“無(wú)師自通”的革命性轉(zhuǎn)換。
對(duì),就是大谷歌的“新狗”AlphaGo Zero的水平已經(jīng)超過(guò)之前所有版本的AlphaGo。在對(duì)陣曾贏下韓國(guó)棋手李世石那版AlphaGo時(shí),AlphaGo Zero取得了100:0的壓倒性戰(zhàn)績(jī)。
2017年5月,以3:0的比分贏下中國(guó)棋手柯潔后,AlphaGo宣布退役,但DeepMind公司并沒(méi)有停下研究的腳步。倫敦當(dāng)?shù)貢r(shí)間10月18日,DeepMind團(tuán)隊(duì)公布了最強(qiáng)版AlphaGo ,代號(hào)AlphaGo Zero。它的獨(dú)門秘籍,是“自學(xué)成才”。而且,是從一張白紙開(kāi)始,零基礎(chǔ)學(xué)習(xí),在短短3天內(nèi),成為頂級(jí)高手。
倫敦當(dāng)?shù)貢r(shí)間10月18日18:00(北京時(shí)間19日01:00),AlphaGo再次登上世界頂級(jí)科學(xué)雜志——《自然》。一年多前,AlphaGo便是2016年1月28日當(dāng)期的封面文章,Deepmind公司發(fā)表重磅論文,介紹了這個(gè)擊敗歐洲圍棋冠軍樊麾的人工智能程序。
團(tuán)隊(duì)稱,AlphaGo Zero的水平已經(jīng)超過(guò)之前所有版本的AlphaGo。在對(duì)陣曾贏下韓國(guó)棋手李世石那版AlphaGo時(shí),AlphaGo Zero取得了100:0的壓倒性戰(zhàn)績(jī)。DeepMind團(tuán)隊(duì)將關(guān)于AlphaGo Zero的相關(guān)研究以論文的形式,刊發(fā)在了10月18日的《自然》雜志上。“AlphaGo在兩年內(nèi)達(dá)到的成績(jī)令人震驚。現(xiàn)在,AlphaGo Zero是我們最強(qiáng)版本,它提升了很多。Zero提高了計(jì)算效率,并且沒(méi)有使用到任何人類圍棋數(shù)據(jù)。最終,我們想要利用它的算法突破,去幫助解決各種緊迫的現(xiàn)實(shí)世界問(wèn)題,如蛋白質(zhì)折疊或設(shè)計(jì)新材料等高新科技領(lǐng)域。如果我們通過(guò)AlphaGo,可以在這些問(wèn)題上取得進(jìn)展,那么它就有潛力推動(dòng)人們理解生命,并以積極的方式影響我們的生活。”
AlphaGo之父、DeepMind聯(lián)合創(chuàng)始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)這樣說(shuō)(上面那段)。
新一代AlphaGoZero(阿法元)的革命性進(jìn)步,除了學(xué)習(xí)的智能還在能耗上有了降低,只用到了一臺(tái)機(jī)器和4個(gè)TPU,極大地節(jié)省了資源。TPU(Tensor Processing Unit)即張量處理單元[1] ,是一款為機(jī)器學(xué)習(xí)而定制的芯片,經(jīng)過(guò)了專門深度機(jī)器學(xué)習(xí)方面的訓(xùn)練,它有更高效能(每瓦計(jì)算能力)。
而上一代GO還需要48個(gè)TPU才能打敗人類!
對(duì)于這一代的阿法元來(lái)說(shuō),其最大也是最耀眼的進(jìn)步就是在機(jī)器智能學(xué)習(xí)的過(guò)程中,已經(jīng)可以完全不需要人類的參與。再此之前的智能,最多只是說(shuō)比人類學(xué)習(xí)東西更快,而阿法元的出現(xiàn)把人工智能的算法推到了另一個(gè)高度,開(kāi)始把人類在機(jī)器智能的學(xué)習(xí)發(fā)展中變得不那么必要,由以前的靠大數(shù)據(jù)喂養(yǎng)變成了自己學(xué)習(xí)。
如果說(shuō)機(jī)器人存在“意識(shí)”的邏輯成立,那么也許這就是開(kāi)始。
當(dāng)然,作為在科技方還算懂點(diǎn)皮毛的人,我們認(rèn)為面對(duì)AI完全沒(méi)必要那么悲觀。
事實(shí)上,人工智能會(huì)成為人類智慧的增強(qiáng)器,幫助我們解決人類正在面臨的一些嚴(yán)峻挑戰(zhàn) 。這樣的AI智能,就像被無(wú)限開(kāi)發(fā)的人的大腦一樣,也許,它能幫我們學(xué)習(xí)和理解那些人類還不懂得人文和生物秘密。
盡管才剛剛發(fā)展起來(lái),AlphaGo Zero已經(jīng)走出了通向上述目標(biāo)的關(guān)鍵一步。對(duì)于希望利用人工智能推動(dòng)人類社會(huì)進(jìn)步為使命的DeepMind來(lái)說(shuō),圍棋并不是AlphaGo的終極奧義,他們的目標(biāo)始終是要利用AlphaGo打造通用的、探索宇宙的終極工具。
AlphaGo Zero的提升,讓DeepMind看到了利用人工智能技術(shù)改變?nèi)祟惷\(yùn)的突破。他們目前正積極與英國(guó)醫(yī)療機(jī)構(gòu)和電力能源部門合作,提高看病效率和能源效率。同時(shí)類似的技術(shù)應(yīng)用在其他結(jié)構(gòu)性問(wèn)題,比如蛋白質(zhì)折疊、減少能耗和尋找新材料上,就能創(chuàng)造出有益于社會(huì)的突破。
從機(jī)器學(xué)習(xí)的算法角度來(lái)說(shuō),這次的GO算得上是質(zhì)的飛躍。
-
頭條初始值發(fā)布。