原標題 Learn Machine Learning in 3 Months 翻譯 | 楊麗 廖穎 字幕 | 凡江 整理 | 廖穎 編輯 | 吳璇
到目前為止,我收到最多的問題,就是怎樣入門機器學習。為此,我制定了一個三個月的學習指南來 你們,更好地從入門級新手變成機器學習的精通者。 同時,為了那些僅能利用閑余時間來學習的人——不管是工作黨,還是學生黨,我都會用視頻進行講解。如果你能全心全意投入學習,就可以事半功倍地達成效果。 首先,我們先來看看 DeepMind 招聘頁面。每每提到發(fā)布的人工智能算法, DeepMind 都稱得上是世界領先的機構。我們來看一下研究工程師職位。這個職位描述所需要負責的是團隊的一部分,需要負責AlphaGo,Deep Q Network 和 WaveNet。它們每一個在 AI 領域都具有革命性。 AI 的最低要求是具有計算機科學學士學位,或是精通 Python,機器學習和算法設計相關領域的人才。在符合以上優(yōu)先條件者中,不需要具備博士學位或發(fā)表一大堆論文。 如果我們要創(chuàng)建一個餅圖來理解機器學習的必要性,它是這樣分布的:其中35%是線性代數,25%是概率論和統(tǒng)計學,15%是微積分,另外的15%是算法及其復雜性,最后的10%就是數據預處理知識。 根據這些要求,我們可以圍繞著這張圖建立我們自己的課程。我將這門課程劃分為三個月。第1個月主要講數學和算法復雜性,第2個月講機器學習,第3個月講最受歡迎的深度學習。 在開始之前我想說的是,你每天的任務之一就是跟上節(jié)奏。 這里是我推薦一些學習資源:
以上所有的資源都是基于視頻的,通過使用視頻和簡短的網絡文本形式可以學得更好。而僅僅使用純文本的方式,記錄下一個個的公式,卻沒有實際應用,效果不佳。 第一個月:數學 現(xiàn)在開始,進入第一個月的學習——數學。我們將從大多數機器學習的組成——線性代數開始。麻省理工公開課中最受歡迎的課程就是Gillbert Strang教授的線性代數課程。在YouTube的播放列表中有35個視頻可以進行觀看,如果時間緊張,可以2倍速觀看每一個視頻,甚至3倍速。 觀看的時候要做筆記,記錄并不是必要的,只是為了鞏固所學。這樣可以使學習更有效率。研究表明,通過手寫筆記,可以提高大腦保存所學概念的能力。 然后就是微積分。 3Blue1Brown 頻道有一個很棒的播放列表叫做微積分的本質,他教你微積分的方式會讓你覺得微積分就像自己發(fā)明的一樣。 學習概率和統(tǒng)計時,edX(麻省理工和哈佛大學聯(lián)手創(chuàng)建的開放在線課堂平臺)有一門很好的課程叫做“科學的不確定性”,你也可以在edX上找到一門很好的算法設計和分析課程。由U penn教授執(zhí)教,每一門課程發(fā)布一周。 我們還得練習加速學習。所謂的加速學習就是每天不間斷學習2到3小時,要像海綿一樣,以更快的速度觀看視頻,看視頻的同時做筆記。在每個星期結束時,完成一個項目,最好是比較難的項目,這樣有利于提升完善自己。 這些項目都有一頁簡介,可以在網上找到。學習僅僅是把數據下載到你的大腦中,你可以使用工具來加速這一過程。 第一周 線性代數: https://ocw./courses/mathematics/18-06-linear-algebra-spring-2010/ 第二周 微積分: https://www./playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr 第三周: https://www./course/introduction-probability-science-mitx-6-041x-2 第四周 算法: https://www./courses?languages=en&query=Algorithm%20design%20and%20analysis 第二個月:機器學習 到第二個月的機器學習,有3個播放列表可以觀看學習——數據科學中的 python,智能數學 和 Tensorflow 的介紹??匆幌耈dacity機器學習課程的免費介紹,制作得相當好。接下來的兩個星期,你可以選擇一些很棒的機器學習項目去完成,利用python編寫自己的代碼。有了好的編譯思想就可以用github鏈接的形式來幫助大家。這個會幫助你了解何時使用特定的機器學習模型以及它是如何在特定的使用案例應用中工作的。 另外,我也建議參加一個非正式的比賽——這是一個好的方法去學習,同時還可以掙錢。通常需要進行分類,能分類出某種類型的問題,某種機器學習模型,這種模型一般是顧問提供給公司的高薪機器學習模型。通過自己建立模型,可以學得更好。 我建議一周選擇兩個項目從頭開始學習,這會為你提供機器學習的實踐經驗,包括優(yōu)化數據預處理,學習類型數據分割和模型評價。這些都是將海綿模式轉換成代碼。許多的數據科學的藝術,在于你做的用于解決特定問題的大量微觀決策。這是練習微觀決策的很好的機會,同時可以評估每一個的結果。 scikit-learn是一個非常簡單的框架,能快速實現(xiàn)一些機器學習模型。你會發(fā)現(xiàn),在完成一個任務的過程當中,你會問自己同樣的問題——如何最好地進行數據分割?什么是最好的參數?…… 月底的時候,你應該給自己最后一個項目,那就是簡單梯度下降算法代碼。這是機器學習中最常用的優(yōu)化策略。如果你可以從頭開始編碼,那么一切都會變得更容易。 第一周 1、數據科學中的python: https://www./watch?v=T5pRlIbr6gg 2、智能數學: https://www./watch?v=xRJCOz3AfYY 3、介紹Tensorflow: https://www./watch?v=2FmcHiLCwTU 第二周 Udacity機器學習: https://eu./course/intro-to-machine-learning--ud120 第三、四周 機器學習項目: https://github.com/NirantK/awesome-project-ideas 第三個月:深度學習 進入第3個月,深度學習是一種特定的算法,即神經網絡算法。這種算法需要給定大量的數據和強大的計算能力,它的效果和時間都優(yōu)于其它算法,這就是為什么它如此受歡迎。 看看我在YouTube上對深度學習課程的介紹,看一下Fast.AI的課程——有36小時高質量課程是免費的。在過去兩周里,僅僅實現(xiàn)了在深度學習應用里實現(xiàn)深度學習應用。期間,你的github上應該至少有5-10個項目涉及到機器學習和深度學習。你可以從簡單的感知器學習到最先進的模型,它們的差異通常只是在結構上的一些小的調整?,F(xiàn)在深層學習空間擁有豐富的技術文獻,其中一些好東西都是免費的。 3個月之后,不管是你機器學習領域工作的工程師,或是開了一家咨詢公司,還是開發(fā)出自己的基于 AI 的產品,都應該有足夠的信心運用你所學的知識。不要告訴自己,我學不會或者我不夠聰明。記住,學習是一個漫長的過程,不管你有多大的年紀,從哪里來,你都可以實現(xiàn)這個目標。借助互聯(lián)網的力量,你可以在這個領域產生影響。 如果你不喜歡我的學習計劃,那就自己制定一個吧。做最適合你自己的事情,最好是讓一個朋友和你一起同步學習,這樣就能彼此監(jiān)督鼓勵,而不半途而廢。只要給自己一個積極的心理暗示,就不會輕易放棄。 人工智能將覆蓋每一個行業(yè),改變它對人類的意義。不管你是否理解它,不管你支持那一邊,這一切都發(fā)生得十分迅猛。 開始你的學習之旅吧,我在這里等大家。
|
|