什么是深度學(xué)習(xí)?
深度學(xué)習(xí)試圖模仿人腦,盡管與大腦的能力相去甚遠(yuǎn),使其能夠從大量數(shù)據(jù)中“學(xué)習(xí)”。
旨在使系統(tǒng)能夠以難以置信的準(zhǔn)確度對(duì)數(shù)據(jù)進(jìn)行聚類并做出預(yù)測(cè)。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,它本質(zhì)上是一個(gè)三層或更多層的神經(jīng)網(wǎng)絡(luò),雖然單層的神經(jīng)網(wǎng)絡(luò)仍然可以進(jìn)行近似預(yù)測(cè),但額外的隱藏層可以幫助優(yōu)化和改進(jìn)準(zhǔn)確性。
深度學(xué)習(xí)驅(qū)動(dòng)了許多人工智能 (AI)應(yīng)用程序和服務(wù),這些應(yīng)用程序和服務(wù)可提高自動(dòng)化、執(zhí)行分析和物理任務(wù)而無需人工干預(yù)。
深度學(xué)習(xí)技術(shù)支持日常產(chǎn)品和服務(wù)(例如數(shù)字助理、支持語音的電視遙控器和信用卡欺詐檢測(cè))以及新興技術(shù)(例如自動(dòng)駕駛汽車)。
深度學(xué)習(xí)與機(jī)器學(xué)習(xí)
如果深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,它們有什么區(qū)別?
深度學(xué)習(xí)與經(jīng)典機(jī)器學(xué)習(xí)的區(qū)別在于它使用的數(shù)據(jù)類型和學(xué)習(xí)方法。
機(jī)器學(xué)習(xí)算法利用結(jié)構(gòu)化的標(biāo)記數(shù)據(jù)進(jìn)行預(yù)測(cè)——這意味著從模型的輸入數(shù)據(jù)中定義特定特征并組織到表格中。
這并不一定意味著它不使用非結(jié)構(gòu)化數(shù)據(jù),通常會(huì)通過一些預(yù)處理將其組織成結(jié)構(gòu)化的格式。
深度學(xué)習(xí)消除了機(jī)器學(xué)習(xí)通常涉及的一些數(shù)據(jù)預(yù)處理。
這些算法可以攝取和處理非結(jié)構(gòu)化數(shù)據(jù),如文本和圖像,并自動(dòng)提取特征,消除對(duì)人類專家的一些依賴。例如,假設(shè)我們有一組不同寵物的照片,我們想按“貓”、“狗”、“倉鼠”等進(jìn)行分類。
深度學(xué)習(xí)算法可以確定哪些特征(例如耳朵)對(duì)于區(qū)分每只動(dòng)物最重要。而不像在機(jī)器學(xué)習(xí)中,這種特征層次結(jié)構(gòu)是由人類專家手動(dòng)建立的。
然后,通過梯度下降和反向傳播的過程,深度學(xué)習(xí)算法調(diào)整和適應(yīng)自身的準(zhǔn)確性,使其能夠以更高的精度對(duì)動(dòng)物的新照片進(jìn)行預(yù)測(cè)。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型也能夠進(jìn)行不同類型的學(xué)習(xí),通常分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
監(jiān)督學(xué)習(xí)利用標(biāo)記數(shù)據(jù)集進(jìn)行分類或進(jìn)行預(yù)測(cè);需要某種人工干預(yù)來正確標(biāo)記輸入數(shù)據(jù)。相比之下,無監(jiān)督學(xué)習(xí)不需要標(biāo)記數(shù)據(jù)集,而是檢測(cè)數(shù)據(jù)中的模式,并通過任何可區(qū)分的特征將它們聚類。強(qiáng)化學(xué)習(xí)是一個(gè)過程,在這個(gè)過程中,模型學(xué)習(xí)變得更加準(zhǔn)確,以便根據(jù)反饋在環(huán)境中執(zhí)行動(dòng)作,以最大化獎(jiǎng)勵(lì)。
深度學(xué)習(xí)的工作原理
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)或人工神經(jīng)網(wǎng)絡(luò)試圖通過數(shù)據(jù)輸入、權(quán)重和偏差的組合來模仿人腦。這些元素協(xié)同工作以準(zhǔn)確識(shí)別、分類和描述數(shù)據(jù)中的對(duì)象。
深度神經(jīng)網(wǎng)絡(luò)由多層互連節(jié)點(diǎn)組成,每一層都建立在前一層之上,以細(xì)化和優(yōu)化預(yù)測(cè)或分類。通過網(wǎng)絡(luò)進(jìn)行的這種計(jì)算過程稱為前向傳播。深度神經(jīng)網(wǎng)絡(luò)的輸入和輸出層稱為可見 層。輸入層是深度學(xué)習(xí)模型攝取數(shù)據(jù)進(jìn)行處理的地方,輸出層是進(jìn)行最終預(yù)測(cè)或分類的地方。
另一個(gè)稱為反向傳播的過程 使用諸如梯度下降之類的算法來計(jì)算預(yù)測(cè)中的誤差,然后通過向后移動(dòng)層以訓(xùn)練模型來調(diào)整函數(shù)的權(quán)重和偏差。前向傳播和反向傳播一起使神經(jīng)網(wǎng)絡(luò)能夠做出預(yù)測(cè)并相應(yīng)地糾正任何錯(cuò)誤。隨著時(shí)間的推移,算法逐漸變得更加準(zhǔn)確。
上面用最簡(jiǎn)單的術(shù)語描述了最簡(jiǎn)單的深度神經(jīng)網(wǎng)絡(luò)類型。
然而,深度學(xué)習(xí)算法極其復(fù)雜,并且有不同類型的神經(jīng)網(wǎng)絡(luò)來解決特定的問題或數(shù)據(jù)集。
例如: 卷積神經(jīng)網(wǎng)絡(luò)CNN,主要用于計(jì)算機(jī)視覺和圖像分類應(yīng)用程序,可以檢測(cè)圖像中的特征和模式,從而實(shí)現(xiàn)目標(biāo)檢測(cè)或識(shí)別等任務(wù)。2015 年,CNN 首次在物體識(shí)別挑戰(zhàn)中擊敗了人類。
循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,通常用于自然語言和語音識(shí)別應(yīng)用程序,因?yàn)樗庙樞蚧驎r(shí)間序列數(shù)據(jù)。
深度學(xué)習(xí)應(yīng)用
現(xiàn)實(shí)世界的深度學(xué)習(xí)應(yīng)用程序是我們?nèi)粘I畹囊徊糠?,但在大多?shù)情況下,它們很好地集成到產(chǎn)品和服務(wù)中,以至于用戶不知道在后臺(tái)進(jìn)行的復(fù)雜數(shù)據(jù)處理。其中一些示例包括:
執(zhí)法 深度學(xué)習(xí)算法可以分析交易數(shù)據(jù)并從中學(xué)習(xí),以識(shí)別表明可能存在欺詐或犯罪活動(dòng)的危險(xiǎn)模式。語音識(shí)別、計(jì)算機(jī)視覺和其他深度學(xué)習(xí)應(yīng)用可以通過從錄音、視頻、圖像和文檔中提取模式和證據(jù)來提高調(diào)查分析的效率和有效性,幫助執(zhí)法部門更快、更準(zhǔn)確地分析大量數(shù)據(jù)。
金融服務(wù) 金融機(jī)構(gòu)經(jīng)常使用預(yù)測(cè)分析來推動(dòng)股票的算法交易、評(píng)估貸款批準(zhǔn)的業(yè)務(wù)風(fēng)險(xiǎn)、檢測(cè)欺詐并幫助管理客戶的信貸和投資組合。
客戶服務(wù) 許多組織將深度學(xué)習(xí)技術(shù)納入其客戶服務(wù)流程。聊天機(jī)器人——用于各種應(yīng)用程序、服務(wù)和客戶服務(wù)門戶——是一種簡(jiǎn)單的人工智能形式。傳統(tǒng)的聊天機(jī)器人使用自然語言甚至視覺識(shí)別,常見于類似呼叫中心的菜單中。然而,更復(fù)雜的聊天機(jī)器人解決方案試圖通過學(xué)習(xí)來確定是否對(duì)模棱兩可的問題有多種回答。根據(jù)收到的回復(fù),聊天機(jī)器人會(huì)嘗試直接回答這些問題或?qū)?duì)話路由給人類用戶。
Apple 的 Siri、Amazon Alexa 或 Google Assistant 等虛擬助手通過啟用語音識(shí)別功能擴(kuò)展了聊天機(jī)器人的概念。這創(chuàng)造了一種以個(gè)性化方式吸引用戶的新方法。
衛(wèi)生保健 自從醫(yī)院記錄和圖像數(shù)字化以來,醫(yī)療保健行業(yè)從深度學(xué)習(xí)能力中受益匪淺。圖像識(shí)別應(yīng)用程序可以支持醫(yī)學(xué)影像專家和放射科醫(yī)生,幫助他們?cè)诟痰臅r(shí)間內(nèi)分析和評(píng)估更多圖像。
深度學(xué)習(xí)硬件要求 深度學(xué)習(xí)需要大量的計(jì)算能力。高性能圖形處理單元CPU是理想的選擇,因?yàn)樗鼈兛梢栽诰哂写罅靠捎脙?nèi)存的多核中處理大量計(jì)算。但是,在本地管理多個(gè) GPU 會(huì)對(duì)內(nèi)部資源產(chǎn)生大量需求,并且擴(kuò)展成本高得令人難以置信。
|