本課程主要講解基于Spark 2.x的機(jī)器學(xué)習(xí)庫(kù),MLlib實(shí)現(xiàn)了常用的機(jī)器學(xué)習(xí),如:聚類、分類、回歸等6大算法,使用Kaggle競(jìng)賽數(shù)據(jù)集模型構(gòu)建。本課拒絕枯燥的講述,將循序漸進(jìn)從Spark2.x的基礎(chǔ)知識(shí)開(kāi)始,然后再透徹講解各個(gè)算法的理論、詳細(xì)展示Spark實(shí)現(xiàn),最后均會(huì)通過(guò)實(shí)例進(jìn)行解析實(shí)戰(zhàn),幫助大家真正從理論到實(shí)踐全面掌握Spark MLlib分布式機(jī)器學(xué)習(xí)。通過(guò)該課程的學(xué)習(xí)同學(xué)們可以全面掌握Spark MLlib機(jī)器學(xué)習(xí),進(jìn)而能夠在實(shí)際工作中進(jìn)行ML的應(yīng)用開(kāi)發(fā)和定制開(kāi)發(fā)。 本課程講解Spark 在機(jī)器學(xué)習(xí)中的應(yīng)用,并介紹如何從各種公開(kāi)渠道獲取用于機(jī)器學(xué)習(xí)系統(tǒng)的數(shù)據(jù)。內(nèi)容涵蓋推薦系統(tǒng)、回歸、聚類、分類等經(jīng)典機(jī)器學(xué)習(xí)算法及其實(shí)際應(yīng)用,涵蓋使用Spark ML Pipeline API創(chuàng)建和調(diào)試機(jī)器學(xué)習(xí)流程,內(nèi)容更加系統(tǒng)、全面、與時(shí)俱進(jìn),適合所有欲借助Spark來(lái)實(shí)現(xiàn)常見(jiàn)機(jī)器學(xué)習(xí)應(yīng)用的開(kāi)發(fā)者。
|
|