談及AI時常聽到的「神經網絡」和「深度學習」到底是什么意思?
神經網絡神經網絡是一個模型。
這個模型可能是參照了人的神經細胞和網絡的構造,也可以理解成有一堆算法的表現形式剛好和神經網絡有些像,然后被形容成神經網絡,形象,高大上。
這個模型是什么?解決這個問題最好的途徑是回顧歷史,找它的起源。
感知器:(英語:Perceptron)是Frank Rosenblatt在1957年就職于Cornell航空實驗室(Cornell Aeronautical Laboratory)時所發明的一種人工神經網絡。它可以被視為一種最簡單形式的前饋神經網絡,是一種二元線性分類器。上邊是對于感知器的解釋,感知器可以看成是最早的神經網絡。感知器同樣有著一個高大上的名詞,不過其本身是一個線性分類器。
線性分類器還是可以理解成一個“模型”。
通過這個模型和一些算法可以將一堆數值轉化成兩個數值,或者一個概率,舉個粗糙的例子:
人是否有好心情和很多因素相關,比如:得到關愛、關愛了別人、遇到喜歡的人、賺錢了、天氣不錯、終于下班了,等等。這些因素可以看成很多數值,但心情好不好只有兩個,心情好和不好。借助感知器這個模型,可以推測人的心情。
感知器可以解決一些實際的問題。不過,有局限性,有局限性就需要解決。
多層感知器(Multilayer Perceptron,縮寫MLP)是一種前向結構的人工神經網絡,映射一組輸入向量到一組輸出向量。MLP可以被看作是一個有向圖,由多個的節點層所組成,每一層都全連接到下一層。除了輸入節點,每個節點都是一個帶有非線性激活函數的神經元(或稱處理單元)。后來,有人提出了多層感知器,解決了之前感知器的一些不足,更加強大了。
多層感知器可以看成是感知器的增強,由于更加復雜,步驟更多,和神經網絡的網絡更像一些。之前的單個感知器更像是神經單元。
多層感知器的提出是在1980年左右,其發展并不順利,到后來隨著算法的進步,特別是反向算法的提出;計算能力的提升;GPU的使用;數據的增多,類似于多層感知器,和神經網絡有些像的模型在機器學習當中才有了更好的表現。
這些模型流行的同時,其對外的表現形式也越發高大上,比如上圖的樣子。
神經網絡現在給外界的感覺已經不是之前的分類器,而是更加注重流程,淡化了中間的細節。
更像一個模型。
深度學習從字面來看,深度學習是深度的機器學習,這里的深度或許可以這樣來看:
計算更加復雜,計算更加深入,結果更好,就像經過深度思考一樣。意思是深度學習算法比傳統機器學習算法厲害。。。。。。
神經網絡中的層數多,可以粗略的看成更深。。。。。。
這里更喜歡這個關于深度學習的由來:
由于多層感知器曾經有一段時間表現并不好,甚至有些負面,近些年崛起之后,為了有一個全新的形象,給起了一個更加牛逼的名字:深度學習。
深度學習(deep neural network)是機器學習的分支,是一種試圖使用包含復雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的算法。深度學習是一種算法。
不過,深度學習的表現過于突出,其含義也更加寬泛,包含神經網絡的模型,包含算法。最終,深度學習有些類似一門學科。
相比神經網絡和深度學習到底是什么,如何更好的使用深度學習的技術,傳統機器學習當中的技術來實現一些應用更為重要。如果沒有使用神經網絡的模型,沒有使用深度學習的算法,但是得到了一個更好的關于機器學習的結果,也挺好。