謝邀!
在回復《人類與AI(人工智能)如何相處?( https://www.wukong.com/answer/6955462920969830692/)》中談了在面對擁有自我意識的機器人,人類該如何與之相處?又該遵從哪些倫理道德?接下來,借著回復此問題,向大家介紹一下AI的三大核心要素(也是AI的三大基石)——數據、算力和算法。
數據是AI算法的“飼料”
在如今這個時代,無時無刻不在產生數據(包括語音、文本、影像等等),AI產業的飛速發展,也萌生了大量垂直領域的數據需求。在AI技術當中,數據相當于AI算法的“飼料”。機器學習中的監督學習(Supervised Learning)和半監督學習(Semi-supervised Learning)都要用標注好的數據進行訓練(由此催生大量數據標注公司,對未經處理的初級數據進行加工處理, 并轉換為機器可識別信息),只有經過大量的訓練,覆蓋盡可能多的各種場景才能得到一個良好的模型。
目前,數據標注是AI的上游基礎產業,以人工標注為主,機器標注為輔。最常見的數據標注類型有五種:屬性標注(給目標對象打標簽)、框選標注(框選出要識別的對象)、輪廓標注(比框選標注更加具體,邊緣更加精確)、描點標注(標注出目標對象上細致的特征點)、其他標注(除以上標注外的數據標注類型)。AI算法需要通過數據訓練不斷完善,而數據標注是大部分AI算法得以有效運行的關鍵環節。
算法是AI的背后“推手”
AI算法是數據驅動型算法,是AI背后的推動力量。
主流的算法主要分為傳統的機器學習算法和神經網絡算法,目前神經網絡算法因為深度學習(源于人工神經網絡的研究,特點是試圖模仿大腦的神經元之間傳遞和處理信息的模式)的快速發展而達到了高潮。
南京大學計算機系主任、人工智能學院院長周志華教授認為,今天“AI熱潮”的出現主要由于機器學習,尤其是機器學習中的深度學習技術取得了巨大進展,并在大數據和大算力的支持下發揮巨大的威力。
當前最具代表性深度學習算法模型有深度神經網絡(Deep Neural Network,簡稱DNN)、循環神經網絡(Recurrent Neural Network,簡稱RNN)、卷積神經網絡(Convolutional Neural Network,簡稱CNN)。談到深度學習,DNN和RNN就是深度學習的基礎。DNN內部的神經網絡層可以分為三類,輸入層,隱藏層和輸出層, 一般來說第一層是輸入層,最后一層是輸出層,而中間的層數都是隱藏層。DNN可以理解為有很多隱藏層的神經網絡,是非常龐大的系統,訓練出來需要很多數據、很強的算力進行支撐。
算力是基礎設施
AI算法模型對于算力的巨大需求,推動了今天芯片業的發展。據OpenAI測算,2012年開始,全球AI訓練所用的計算量呈現指數增長,平均每3.43個月便會翻一倍,目前計算量已擴大30萬倍,遠超算力增長速度。
在AI技術當中,算力是算法和數據的基礎設施,支撐著算法和數據,進而影響著AI的發展,算力的大小代表著對數據處理能力的強弱。算力源于芯片,通過基礎軟件的有效組織,最終釋放到終端應用上,作為算力的關鍵基礎,AI芯片的性能決定著AI產業的發展。
加快補齊AI芯片短板
從技術架構來看,AI芯片可以分為四大類:通用性芯片(GPU,特點是具備通用性、性能高、功耗高)、半定制化芯片(FPGA,特點是可編程、功耗和通用性一般)、全定制化芯片(ASIC,特點是不能擴展、性能穩定、功耗可控)和類腦芯片(特點是功耗低、響應速度快)。
AI本質上是使用人工神經網絡對人腦進行的模擬,旨在替代人們大腦中的生物神經網絡。由于每個任務對芯片的要求不同,所以可以使用不同的AI芯片進行訓練和推理。
在過去二十年當中,處理器性能以每年大約55%的速度提升,內存性能的提升速度每年只有10%左右,存儲速度嚴重滯后于處理器的計算速度。隨著AI技術的發展,所需數據量變得越來越大,計算量越來越多,“內存墻”(指內存性能嚴重限制CPU性能發揮的現象)的問題越來越嚴重。因此,存算一體(將部分或全部的計算移到存儲中,計算單元和存儲單元集成在同一個芯片,在存儲單元內完成運算)有望成為解決芯片性能瓶頸及提升效能比的有效技術手段。
目前,數據中心中核心算力芯片各類通用的GPU占主導地位。IDC的研究指出,2020年,中國的GPU服務器占據95%左右的市場份額,是數據中心AI加速方案的首選。但IDC也做出預測,到2024年,其他類型加速芯片的市場份額將快速發展,AI芯片市場呈現多元化發展趨勢。
近些年來,我國AI雖然取得了不少的突破和進展(例如小i機器人主導了全球第一個AI情感計算的國際標準),并在國際上具備一定的競爭力,但AI芯片對外依賴較大(根據賽迪智庫人工智能產業形勢分析課題組研究指出,國內AI芯片廠商需要大量依靠高通、英偉達、AMD等國際巨頭供貨),并缺乏AI框架技術(深度學習主流框架TensorFlow、Caffe等均為美國企業或機構掌握)的支撐。
未來人們對科技的依賴會與日俱增,AI也將會成為大國競爭的焦點。為擺脫我國AI的短板,有專家表示AI芯片方面我國可以借鑒開源軟件成功經驗,降低創新門檻,提高企業自主能力,發展國產開源芯片;算法框架方面則可通過開源形成廣泛的應用生態,廣泛支持不同類型的AI芯片、硬件設備、應用等。
算法、算力、數據作為AI核心三要素,相互影響,相互支撐,在不同行業中形成了不一樣的產業形態,隨著算法的創新、算力的增強、數據資源的累積,傳統基礎設施將借此東風實現智能化升級,并有望推動經濟發展全要素的智能化革新,讓人類社會從信息化進入智能化。
最后,再順便打個小廣告,“陳思進財經漫畫”系列第一部《漫畫生活中的財經》新鮮出爐,謝謝關注!
你對這個問題有什么更好的意見嗎?歡迎在下方留言討論!