色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

如何入門機器學習

劉姿婷2年前22瀏覽0評論

如何入門機器學習?

寫個簡單的入門貼:

機器學習,機器運用一套通用的算法——泛型算法,自動建立起數據邏輯。

For example:

用于分類的泛型算法是能夠把一組數據分門別類的,比如識別手寫輸入和區分垃圾郵件都可以用分類的泛型算法來實現,

此時,可以把機器學習算法看成一個黑盒子,兩個任務輸入的數據不一樣,中間經過機器學習算法的作用,輸出不同的結果。

機器學習可以分為有監督學習、無監督學習、半監督學習、強化學習等。這里的監督其實是指用來訓練機器學習模型的數據是有標注的,而無監督學習就是沒有標注數據,半監督學習是二者的結合,強化學習是對外界環境給的激勵或懲罰信號學習自身的策略。下面咱們先從有監督學習開始:

假設,你現在是房地產經紀人,需要對房子進行相對準確的估價。你有一些所在城市三個月內房產交易的信息數據,包括房間數目、房子大小、周邊地區環境,以及交易價格等。因為涉及了幾個因素,你可能需要一個程序來幫你做這件事情,輸入這些相關的信息,程序就能預估出房子的價格。

那么建立一個能預估房價的應用程序,你需要把關于每間房子的數據信息——“訓練數據”——輸入你的機器學習算法中,算法就會得出用于解決這些數據關系的一套數學公式。這就有點像一份數學考試的答案紙被涂掉了所有的算術符號,就像下面這張圖。

現在我們試試編寫那個房屋估價的程序吧!

假設你現在對“機器學習”一無所知,你大概會寫一些房屋估價相關的一些基本規律和規則吧?就像這樣:它是上面那些元素互相作用的一個結果,會有一些如果、否則的邏輯,最后都會形成一個數學公式,不管是簡單的還是復雜的。

其實,這里面的邏輯就可以讓機器學習算法來幫我們實現,那我們需要怎么做呢?

第一步:

把各個指標設置為1.0

第二步:

運用所有你了解的房產價格信息來測試你的程序,檢查你求得的函數輸出的結果與實際房價的偏差。

第三步:

運用所有可能的指標組合重復第二步。找到能讓你函數的“成本費用”最大程度地降至零的指標組合,那你的問題就解決了。

根據上面提到的步驟二中的數據信息寫一個簡單的等式關系:

這個就是你的“成本費用函數”

現在,試著用機器學習的數學術語把這個等式關系重寫一次

θ代表你當前的指標數,J(θ)代表在當前的指標數下你的成本費用。這個等式關系就代表著我們現在的價值預估函數與實際的偏差程度。

我們的成本費用函數曲線圖圖像呈現一個碗狀,縱坐標表示成本費用。這個圖像中藍色的最低點就是我們成本費用的最低值,意味著我們的函數偏差值最小。相反,最高點就是我們函數偏差值達到最大。所以,當我們找到能使這個圖像達到最低點的指標值的時候,問題就解決了。

如果你還記得微積分學的一些知識的話,你應該會記得如果你求出了函數的導數,就相當于知道了這個函數在各個點的切線斜率。換句話來說,就是知道了哪個方向角度能使我們在圖像上呈下降趨勢,我們可以借助這些知識來接近圖像最低點。這個稱之為“梯度下降法”。

怎樣進一步了解機器學習呢?建議從Andrew Ng在Coursera開設的免費機器學習課程開始學習,還可以下載安裝SciKit-Learn,基本上有大多數算法的python實現,可以對各種不同的機器學習算法進行實踐和研究。