盡管機(jī)器狗的能力很強(qiáng),但它們往往無(wú)法與真實(shí)的動(dòng)物相媲美。這部分原因在于,要直接從狗狗身上學(xué)習(xí)如何像它們一樣走路是很難的--但來(lái)自谷歌人工智能實(shí)驗(yàn)室的這項(xiàng)研究卻讓它變得簡(jiǎn)單得多。谷歌團(tuán)隊(duì)與加州大學(xué)伯克利分校合作,目的是找到一種方法,使四足機(jī)器狗能夠像真正的狗狗一樣進(jìn)行輕盈小跑等"敏捷行為"。正如研究人員在博文中指出,既定的訓(xùn)練過(guò)程往往"需要大量的專家洞察力,而且往往需要對(duì)每一個(gè)期望的技能進(jìn)行冗長(zhǎng)的獎(jiǎng)勵(lì)調(diào)整過(guò)程。"
狗狗的動(dòng)作方式可能與機(jī)器狗的動(dòng)作方式并不完全一致,導(dǎo)致后者倒下、鎖定或其他方面的失敗。而谷歌的AI項(xiàng)目就解決了這個(gè)問(wèn)題,在正常的秩序中加入了一點(diǎn)可控的混亂。通常情況下,狗的動(dòng)作會(huì)被捕捉到,并對(duì)腳和關(guān)節(jié)等關(guān)鍵點(diǎn)進(jìn)行仔細(xì)追蹤。在數(shù)字模擬中,這些點(diǎn)會(huì)被模擬成機(jī)器狗的樣子,虛擬版的機(jī)器狗會(huì)嘗試用自己的動(dòng)作模仿狗的動(dòng)作,邊學(xué)邊做。
盡管研究人員取得了不錯(cuò)的效果,但當(dāng)試圖用模擬的結(jié)果來(lái)控制一個(gè)實(shí)際的機(jī)器狗時(shí)仍會(huì)出現(xiàn)問(wèn)題。真實(shí)世界不是一個(gè)二維平面,沒(méi)有理想化的摩擦力規(guī)則之類的東西。不幸的是,這意味著未經(jīng)修正的模擬步態(tài)往往會(huì)讓機(jī)器狗直接摔到地面上。
為了防止這種情況的發(fā)生,研究人員在模擬中使用的物理參數(shù)中引入了隨機(jī)性元素,使虛擬機(jī)器狗的重量更重,或者電機(jī)更弱,或者與地面的摩擦力更大。這使得描述如何行走的機(jī)器學(xué)習(xí)模型必須考慮到各種小的變異,以及如何抵消它們。
通過(guò)學(xué)習(xí)來(lái)適應(yīng)這種隨機(jī)性,使得學(xué)習(xí)后的行走方法在現(xiàn)實(shí)世界中更加穩(wěn)健,從而可以通過(guò)模仿目標(biāo)狗的行走方式,甚至可以模仿出更復(fù)雜的動(dòng)作,比如轉(zhuǎn)彎和旋轉(zhuǎn),而不需要任何人工干預(yù),只需要進(jìn)行一點(diǎn)額外的虛擬訓(xùn)練。當(dāng)然,如果需要的話,還可以加入手動(dòng)調(diào)整,但就目前的情況來(lái)看,這比起以前完全自動(dòng)完成的動(dòng)作,還是有很大的進(jìn)步。
在同一篇文章中描述的另一個(gè)研究項(xiàng)目中,另一組研究人員描述了一個(gè)機(jī)器狗可以自行行走,但被植入了避免在指定區(qū)域外行走,并在跌倒時(shí)自行爬起的能力。有了這些基本技能的烘托,機(jī)器狗能夠在沒(méi)有人類干預(yù)的情況下,在訓(xùn)練區(qū)域內(nèi)不斷地在完善,學(xué)習(xí)到了相當(dāng)令人印象深刻的運(yùn)動(dòng)技能。