人工神經(jīng)網(wǎng)絡(luò)怎么工作?
AlphaGo團(tuán)隊(duì)的高級(jí)搜索科學(xué)家在造就Talk的演講上,以AlphaGo為例,詳細(xì)闡釋了神經(jīng)網(wǎng)絡(luò)是如何工作的。
大家好,我叫默里·沙納漢,是倫敦帝國(guó)理工學(xué)院認(rèn)知機(jī)器人學(xué)教授。大約在六個(gè)月前,我還在Google的DeepMind部門兼職。
今天我來(lái)到這里和大家交流人工智能,大致探討一下人工智能的現(xiàn)在和未來(lái)。
為什么AI最近變得如此令人矚目?
為什么AlphaGo是一個(gè)激動(dòng)人心的里程碑項(xiàng)目?它的局限性在哪里?
我們?nèi)绾尾拍茉谟谐蝗眨瑢?shí)現(xiàn)接近人類水平的人工智能?它的阻礙有哪些?
造就Talk第212位講者 默里·沙納漢(Murray Shanahan)倫敦帝國(guó)理工學(xué)院認(rèn)知機(jī)器人學(xué)系教授
DeepMind高級(jí)搜索科學(xué)家
首先我想說說人工智能的定義。
可以說,人工智能是計(jì)算機(jī)和機(jī)器人的架構(gòu),可以執(zhí)行通常被認(rèn)為需要人類智能完成的任務(wù)。當(dāng)然,這個(gè)定義又需要輔以其他的解釋,它引出了什么是智能的問題。
我所喜歡的對(duì)于智能的準(zhǔn)確定義是,智能是指在多變的環(huán)境下實(shí)現(xiàn)目標(biāo),以及做出適當(dāng)決策的能力。
多變性才是通用智能的關(guān)鍵。
然而當(dāng)前多數(shù)的人工智能,面向的都是特定的應(yīng)用方向,例如下棋、自駕車、醫(yī)療診斷,或者在相冊(cè)中對(duì)照片進(jìn)行標(biāo)記等。它涉及的是對(duì)這些應(yīng)用有用處的那部分技術(shù),例如,理解計(jì)算機(jī)視覺、語(yǔ)言或?qū)W習(xí)等。
最近有一些報(bào)告已經(jīng)在嘗試量化人工智能技術(shù)對(duì)于未來(lái)十年的經(jīng)濟(jì)影響。這是埃森哲公司的一份報(bào)告,他們認(rèn)為,人工智能有著巨大的經(jīng)濟(jì)影響潛力。許多西方國(guó)家的年度經(jīng)濟(jì)增長(zhǎng)幅度在很多方面,將因人工智能的幫助而比沒有人工智能時(shí)翻倍。
中國(guó)國(guó)務(wù)院最近發(fā)布了一項(xiàng)行動(dòng)計(jì)劃,將致力于讓中國(guó)在2030年成為人工智能領(lǐng)域的領(lǐng)先創(chuàng)新國(guó)之一。
普華永道事務(wù)所今年發(fā)表的報(bào)告也認(rèn)為,在未來(lái)幾十年里,人工智能技術(shù)對(duì)國(guó)內(nèi)生產(chǎn)總值的貢獻(xiàn)將會(huì)非常顯著。
尤其是在中國(guó),這種影響將是最大的。
為什么我們對(duì)于AI技術(shù)的經(jīng)濟(jì)影響力會(huì)有如此大的期待呢?
兩個(gè)里程碑現(xiàn)在,我們來(lái)看看人類在AI領(lǐng)域所取得的進(jìn)步,以及所有輿論渲染和期望的理由是什么。
讓我們回到歷史上的1997年,20年前,一臺(tái)名叫深藍(lán)(Deep Blue)的IBM計(jì)算機(jī)打敗了加里·卡斯帕羅夫(Garry Kasparov),當(dāng)時(shí)的國(guó)際象棋世界冠軍。卡斯帕羅夫在這場(chǎng)比賽中被打敗,這被廣泛認(rèn)為是人工智能領(lǐng)域的一個(gè)非常重要的里程碑,一個(gè)非常重要的成就。
有趣的是,即使我們能夠造出棋藝達(dá)到如此水平的計(jì)算機(jī),但是大家依然認(rèn)為我們沒有真正實(shí)現(xiàn)人類水準(zhǔn)的人工智能。人類還有很多事情是計(jì)算機(jī)無(wú)法企及的,哪怕是非常普通的日常事務(wù)。
此后的二十年來(lái),我們突飛猛進(jìn),在2016年,DeepMind的AlphaGo以4:1的戰(zhàn)績(jī)打敗了韓國(guó)頂尖圍棋大師李世石,第二年,AlphaGo又成功打敗了中國(guó)的柯潔。
這是出乎人們意料的。很多人原以為,要想讓計(jì)算機(jī)在類似圍棋這種智力博弈中達(dá)到專業(yè)級(jí)別,需要很長(zhǎng)的時(shí)間。
國(guó)際象棋可能的走法數(shù)量非常龐大,但是還沒有大到計(jì)算機(jī)用純粹蠻力運(yùn)算解決不了的程度。
“深藍(lán)”破解國(guó)際象棋的辦法就是窮舉所有可能的走法,以及對(duì)手可能采取的對(duì)策,然后再算出自己的下一步對(duì)策等,進(jìn)而得出一個(gè)包含各種可能性的樹狀結(jié)構(gòu)。這個(gè)樹狀結(jié)構(gòu)展開后非常非常龐大。
人類無(wú)法用這種蠻力方式來(lái)破解棋局。例如心里想著:“我先這樣走,對(duì)方再那樣走,然后我又這樣走,對(duì)方會(huì)不會(huì)再那樣走?”人類棋手這樣算幾步?jīng)]問題,但大體上講,高手都是依靠自己的直覺判斷以及套用棋譜的能力。
而計(jì)算機(jī)對(duì)國(guó)際象棋的處理方式依靠的并不是直覺判斷,也不是套用棋譜,而是利用超強(qiáng)的計(jì)算能力,超快的計(jì)算速度,來(lái)窮舉這棵巨大的可能性之樹。
但是,由于圍棋的可能性之樹大到遠(yuǎn)遠(yuǎn)超過了國(guó)際象棋,用窮舉的辦法也行不通。
這就是為什么很多人認(rèn)為我們永遠(yuǎn)造不出具備職業(yè)水平的圍棋計(jì)算機(jī)。即使憑借當(dāng)今的計(jì)算能力,依然遠(yuǎn)遠(yuǎn)不能用蠻力窮舉的辦法來(lái)破解圍棋。
DeepMind采用的辦法是設(shè)法模仿了這種對(duì)棋盤局面進(jìn)行直覺判斷的能力。如果你有關(guān)注過當(dāng)時(shí)的比賽,就會(huì)知道AlphaGo甚至首創(chuàng)了一些新的走法。它贏下比賽的某些走法是人類的圍棋高手們前所未見的。
AlphaGo有多強(qiáng)?那么AlphaGo具體的工作原理是怎樣的呢?
和IBM的“深藍(lán)”類似,AlphaGo也會(huì)搜索這種可能性之樹,它使用了蒙特卡羅樹搜索法,也就是說,它會(huì)在搜索樹中進(jìn)行隨機(jī)搜索。這是AlphaGo非常關(guān)鍵的一種工作方式。
它與深藍(lán)的工作方式不同之處在于,它使用神經(jīng)網(wǎng)絡(luò)算法來(lái)修剪這棵樹。對(duì)于這棵巨大的可能性之樹,AlphaGo通過削減分支,并使用神經(jīng)網(wǎng)絡(luò)算法限制探索的范圍。
它對(duì)龐大的人類專業(yè)棋手對(duì)弈數(shù)據(jù)庫(kù)進(jìn)行深度學(xué)習(xí),憑借這個(gè)人類專業(yè)棋手對(duì)弈數(shù)據(jù)庫(kù),兩個(gè)神經(jīng)網(wǎng)絡(luò)得到了訓(xùn)練。
其中一個(gè)神經(jīng)網(wǎng)絡(luò)思考棋盤上的態(tài)勢(shì),分析當(dāng)前局勢(shì)的好壞;另一個(gè)神經(jīng)網(wǎng)絡(luò)則會(huì)分析棋盤局勢(shì)并分析專業(yè)棋手下一步最有可能怎么走。
憑借這些信息,它可以削減巨大的可能性,從而只去搜索那些潛在的好的招式,因?yàn)樗鼜娜祟悓<覕?shù)據(jù)庫(kù)中學(xué)到了怎么走才算是好棋。對(duì)于AlphaGo來(lái)說,只有當(dāng)這一步棋對(duì)局勢(shì)起到積極作用的時(shí)候,它才會(huì)去繼續(xù)搜索。
它還使用一種稱為強(qiáng)化學(xué)習(xí)的技術(shù)。強(qiáng)化學(xué)習(xí)是通過試錯(cuò)法來(lái)學(xué)習(xí),它會(huì)與自己對(duì)弈。AlphaGo利用對(duì)人類技法的學(xué)習(xí)成果不斷地和自己對(duì)弈,這會(huì)讓它的訓(xùn)練得到大幅提升。
AlphaGo本身只是個(gè)圍棋項(xiàng)目,然而,從諸多方面來(lái)講,AlphaGo真正重要的是它所使用的基礎(chǔ)技術(shù)具有更廣泛的應(yīng)用,而不僅限于圍棋。
計(jì)算能力不是唯一
AlphaGo的能力給人留下了深刻印象,但是人類水平的人工智能呢?我們?cè)诳苹秒娪爸锌吹降哪切┚跋竽兀?/p>
有些作家,例如雷蒙德·庫(kù)茨魏爾,曾經(jīng)預(yù)言,人類水平的人工智能到本紀(jì)20年代就會(huì)出現(xiàn)。
他的依據(jù)是,先算出人腦的神經(jīng)元數(shù)量然后算出需要多少計(jì)算能力來(lái)模擬它們。再推斷我們什么時(shí)候能實(shí)現(xiàn)那種計(jì)算能力,當(dāng)你推斷出計(jì)算能力的增長(zhǎng)曲線的時(shí)候,例如這里顯示的是世界前五百?gòu)?qiáng)超級(jí)計(jì)算機(jī)的運(yùn)算速度,由此可知,有能力模擬人腦所有神經(jīng)元的計(jì)算能力,會(huì)在本世紀(jì)20年代出現(xiàn)。
但我認(rèn)為真正的結(jié)論比這更復(fù)雜,那么我來(lái)解釋一下理由。
計(jì)算能力不是實(shí)現(xiàn)人類水平人工智能的唯一條件,因?yàn)槲覀冋娴男枰宄绾卫眠@些計(jì)算能力。
問題在于,人工智能軟件的進(jìn)步是否符合硬件的進(jìn)步,我認(rèn)為要想實(shí)現(xiàn)人類水平的人工智能還有很多問題丞待解決。我可以通過再次思考AlphaGo的案例來(lái)得出結(jié)論。
AlphaGo顯然非常聰明。我們知道它甚至表現(xiàn)出了某種創(chuàng)造力,甚至它的設(shè)計(jì)師和圍棋大師也不完全了解它在做什么。
然而,和所有專業(yè)的人工智能一樣,AlphaGo實(shí)際上在很多方面又不夠聰明,因?yàn)樗茏龅闹皇窍聡澹绻覀儊?lái)看一下李世石或者柯潔,他們不僅會(huì)下圍棋,也可以做所有我們都會(huì)做的日常事情,比如和他人交談,陪小孩子玩,或是下廚做飯。
這些事情柯潔可以做,李世石可以做,我也可以做,但AlphaGo只會(huì)下圍棋。AlphaGo甚至都不知道日常事務(wù)的復(fù)雜程度。
為了實(shí)現(xiàn)人工通用智能(即人類水平的人工智能),我們需要滿足其他一些條件。用英語(yǔ)表達(dá),就是三個(gè)C:
創(chuàng)造力(Creativity)
常識(shí)(Common sense)
抽象概念(abstract Concepts)
我們需要?jiǎng)?chuàng)造力,不斷去嘗試新的可能性,但只有當(dāng)計(jì)算機(jī)具備常識(shí)的時(shí)候才能做到。
常識(shí)是理解日常生活中的日常行為結(jié)果的能力。我們對(duì)我們周圍的各種日常事物以及它們的工作方式都有一個(gè)共同的認(rèn)知。
比如說你的房子,或者是在街上,我們知道如果操縱它們,移動(dòng)它們,擠壓它們,會(huì)發(fā)生什么。對(duì)社會(huì)領(lǐng)域,我們也有共同的理解。
但我們還不知道如何讓計(jì)算機(jī)具備這種能力,讓它們有能力形成人類所遵從的抽象概念,幫助我們?cè)谛碌沫h(huán)境中進(jìn)行泛化應(yīng)用。
要想實(shí)現(xiàn)人類水平的人工智能,就要先實(shí)現(xiàn)這些才行。實(shí)際上,我不知道我們什么時(shí)候才能實(shí)現(xiàn)這個(gè)目標(biāo)。我認(rèn)為在這一天到來(lái)之前,還有未知數(shù)量的概念上的障礙。
在技術(shù)奇點(diǎn)降臨之前然而,假設(shè)這一天終會(huì)到來(lái),那么屆時(shí)我們將會(huì)處于某些人所說的技術(shù)奇點(diǎn)。
在那之前,我認(rèn)為我們不得不開始思考一些至關(guān)重要的事情。
我們必須思考由此帶來(lái)的技術(shù)性失業(yè)問題,我們必須思考自身對(duì)于技術(shù)的依賴。我們不能過分依賴技術(shù)。我們希望確保我們的技術(shù)是安全可靠的。
如果真能實(shí)現(xiàn)人類水平的人工智能,那么這些擔(dān)憂將會(huì)變得更加深遠(yuǎn)。
盡管如此,假設(shè)我們真能掌控一切,那么就有可能為人們的生活帶來(lái)非常非常顯著且有益的改善。如果計(jì)算機(jī)和人工智能能夠?qū)崿F(xiàn)某種烏托邦,那么我們必須向自己提出一些真正深刻且重要的問題,比如:
作為人類,我們真正想要的是什么?
幸福生活的標(biāo)準(zhǔn)是什么?
我認(rèn)為這些爭(zhēng)論和問題會(huì)超越文化和政治分歧。這些是我們都要去探討的事情。
最后我要說,即使人類水平的人工智能可能需要很久才能實(shí)現(xiàn),但是專門化的人工智能技術(shù)現(xiàn)在已經(jīng)有了,必定會(huì)越來(lái)越強(qiáng)大,也會(huì)帶來(lái)巨大的影響。
非常感謝。
關(guān)于AlphaGo Zero如何打敗AlphaGo Master,關(guān)注“造就”,在主頁(yè)文章列表中查看:
新版阿法狗3天超越3000年,人類邁出了被機(jī)器奴役的第一步嗎?
造就:劇院式的線下演講平臺(tái),發(fā)現(xiàn)最有創(chuàng)造力的思想