|
如今很難躲過人工智能(AI)和機(jī)器學(xué)習(xí)方面的炒作新聞。據(jù)IDC公司在2017年9月份的預(yù)測,2017年全球認(rèn)知和AI解決方案支出在120億美元左右。這個數(shù)字可能會以50.1%的年復(fù)合增長率(CAGR)增長,一直持續(xù)到2021年,到時市場規(guī)模會達(dá)到驚人的576億美元。 弗雷斯特研究公司在2018年預(yù)測中預(yù)測,今年,“AI將重塑數(shù)據(jù)分析和企業(yè)創(chuàng)新”,“AI將幫20%的公司做出決定、提供實時指導(dǎo)?!辈贿^該公司也提醒,“CIO們會在2018年認(rèn)識到AI等新技術(shù)需要付出艱辛的工作?!?/span> 對許多企業(yè)組織來說,這艱辛的工作大部分需要先了解機(jī)器學(xué)習(xí)和人工智能框架。據(jù)Gartner聲稱,“59%的企業(yè)組織仍在收集信息以制定AI戰(zhàn)略。” 這種信息收集大部分可能會緊緊圍繞開源解決方案。市面上有許多領(lǐng)先的AI工具采用開源許可證,最前沿的研發(fā)大多數(shù)出現(xiàn)在這些開源項目上。 那么企業(yè)的IT經(jīng)理應(yīng)調(diào)查研究哪些開源AI解決方案?本文著重介紹了已變得極其流行的十大開源AI和機(jī)器學(xué)習(xí)工具。 1. TensorFlow 谷歌開發(fā)的TensorFlow已成為如今使用最廣泛的機(jī)器學(xué)習(xí)框架之一。該項目的GitHub頁面上有87700多顆星,分支次數(shù)超過了42700次。2017年GitHub Octoverse報告將這個開源AI工具列為分支最多的頭號項目、貢獻(xiàn)者數(shù)量方面的第五大項目和評論人數(shù)方面的第十大項目。 它尤其廣泛用于基于云的應(yīng)用,比如亞馬遜網(wǎng)絡(luò)服務(wù)、微軟Azure和谷歌云平臺都提供支持及/或與TensorFlow兼容的服務(wù)。據(jù)項目官網(wǎng)介紹,使用它的公司包括Airbnb、英偉達(dá)、優(yōu)步、SAP、Dropbox、eBay、谷歌、英特爾、可口可樂、Twitter及其他許多公司。 相關(guān)鏈接:https://www./ 2. Scikit-Learn Scikit-learn 基于另外三個開源項目:NumPy、SciPy和matplotlibe,它是一種基于Python的機(jī)器學(xué)習(xí)工具,側(cè)重數(shù)據(jù)挖掘和數(shù)據(jù)分析。它提供諸多算法:分類、遞歸、聚類、降維、模型選擇和預(yù)處理。用戶包括Spotify、Evernote、OKCupid、Change.org及其他許多公司。它開始是谷歌的Summer of Code項目,后續(xù)開發(fā)得到了幾家組織的資助,包括法國國家信息與自動化研究所(INRIA)、巴黎-薩克雷數(shù)據(jù)科學(xué)中心、紐約大學(xué)、巴黎高等電信學(xué)院、哥倫比亞大學(xué)、Alfred P. Sloan基金會和悉尼大學(xué)。在GitHub上,它有25300多顆星和12900多個分支。 相關(guān)鏈接:http:///stable/ 3. Caffe Caffe是賈揚(yáng)清的杰作,他在加州大學(xué)伯克利分校攻讀博士學(xué)位期間開發(fā)了這個項目。伯克利人工智能研究中心(BAIR)現(xiàn)在處理日常開發(fā)工作。項目官網(wǎng)聲稱這是一種“開發(fā)當(dāng)初著眼于表達(dá)式、速度和模塊化的深度學(xué)習(xí)框架?!敝饕δ馨ǎ罕磉_(dá)式架構(gòu)、可擴(kuò)展代碼、高速性能以及學(xué)術(shù)用戶和行業(yè)用戶組成的龐大社區(qū)。在GitHub上,該項目有22600多顆星和13800多個分支。 相關(guān)鏈接:http://caffe./ 4. 微軟認(rèn)知工具包
微軟認(rèn)知工具包(之前名為CNTK)自稱是“一種免費、易于使用、開源、商業(yè)級的工具包,可以訓(xùn)練深度學(xué)習(xí)算法,像人腦那樣來學(xué)習(xí)”。這款A(yù)I解決方案是在微軟內(nèi)部開發(fā)出來的,微軟在2016年發(fā)布了開源版。 這款工具的主要功能包括:支持Python、C++和BrainScript;強(qiáng)化學(xué)習(xí)、生成式對抗網(wǎng)絡(luò)以及監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí);高效使用資源;與NumPy協(xié)同運(yùn)行;并與微軟Azure集成。它在GitHub上有13700多顆星和3600多個分支。 相關(guān)鏈接:https://www.microsoft.com/en-us/cognitive-toolkit/ 5. PredictionIO
Apache項目 PredictionIO是一種開源機(jī)器學(xué)習(xí)服務(wù)器系統(tǒng),它充分利用了其他許多Apache大數(shù)據(jù)工具,比如Hadoop、HBase和Spark。企業(yè)組織常常用它來實施lambda架構(gòu),官網(wǎng)將它作為包括Apache Spark、MLlib、HBase、Spray和Elasticsearch的整個機(jī)器學(xué)習(xí)堆棧的一部分來提供。該項目的目的是幫助數(shù)據(jù)科學(xué)家和開發(fā)人員迅速創(chuàng)建可以作為一項Web服務(wù)來部署的預(yù)測引擎。GitHub頁面顯示有10900多顆星和1777多個分支。 相關(guān)鏈接:http://predictionio.incubator./index.html 6. Deeplearn.js
顧名思義,deeplearn.js是一種面向深度學(xué)習(xí)的JavaScript庫。它讓用戶可以在瀏覽器中訓(xùn)練神經(jīng)網(wǎng)絡(luò)。與本文介紹的另外幾個開源AI項目一樣,它同樣源于谷歌Brain團(tuán)隊,谷歌繼續(xù)在支持該項目。Deeplearn.js包括兩套獨立的API:類似NumPy的直接執(zhí)行模型和更像TensorFlow的延遲執(zhí)行模型。在GitHub上,它有6000多顆星和550多個分支。 相關(guān)鏈接:https:/// 7. Pattern
Pattern由安特衛(wèi)普大學(xué)的計算語言學(xué)和語言心理學(xué)(CLiPS)研究中心開發(fā)。它提供諸多人工智能功能,包括數(shù)據(jù)挖掘、自然語言處理、機(jī)器學(xué)習(xí)、網(wǎng)絡(luò)分析和可視化。它基于Python,隨帶50多個示例和350多個單元測試。GitHub用戶對它標(biāo)星了6000多次,分支了1100多次。 相關(guān)鏈接:https://www.clips./pages/pattern 8. Turi Create
Turi Create旨在讓不是專家的人不必編寫大量代碼,也能構(gòu)建自己的機(jī)器學(xué)習(xí)模型。它適用于創(chuàng)建推薦引擎、圖像分析工具和文本分類引擎,它包括眾多方面的算法:分類、遞歸、圖形分析、聚類、近鄰、主題模型及更多。蘋果最近(2017年12月)才在GitHub上發(fā)布了該工具,但已經(jīng)備受關(guān)注,積聚了5700多顆星和490多個分支。 相關(guān)鏈接:https://github.com/apple/turicreate 9. Aerosolve
Aerosolve由Airbnb開發(fā),這款人工智能工具尤其擅長處理地理數(shù)據(jù)。賴以成名的地方是,它是為“對人類友好”而設(shè)計的。主要功能包括:基于Thrift(Thrift 是Apache開發(fā)的多語言協(xié)作平臺)的特征表示、特征轉(zhuǎn)換語言、可調(diào)試模型、支持Java和Scala,還包括圖像內(nèi)容分析代碼。在GitHub頁面上,它有4200多顆星和550多個分支。 相關(guān)鏈接:http:///aerosolve/ 10. DSSTNE
DSSTNE的全稱是“深度可擴(kuò)展稀疏張量網(wǎng)絡(luò)引擎”,它由亞馬遜開發(fā)。這家網(wǎng)上購物巨頭用DSSTNE來構(gòu)建自己的推薦引擎,該AI工具引起了其他零售商和網(wǎng)上企業(yè)的濃厚興趣。其開發(fā)人員表示,它特別適合機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)寥寥無幾的使用場合。在GitHub上,它有4000多顆星和660多個分支。
作者:Cynthia Harvey |
|
|
來自: 萬皇之皇 > 《IT互聯(lián)》