遙感影像目標(biāo)檢測作為計算機(jī)視覺中的基本視覺識別問題,目標(biāo)檢測在過去的幾十年中得到了廣泛地研究。目標(biāo)檢測旨在給定圖像中找到具有準(zhǔn)確定位的特定對象,并為每個對象分配一個對應(yīng)的標(biāo)簽。高分辨率遙感影像目標(biāo)檢測是遙感圖像處理領(lǐng)域中的研究熱點,在軍事和民用等應(yīng)用廣泛。 目標(biāo)檢測一直以來都是計算機(jī)視覺的一個重要研究方向。 目標(biāo)檢測包含兩個任務(wù):一是待檢測圖像中是否含有特定目標(biāo);二是確定該目標(biāo)的具體位置。高分辨率遙感影像上的典型目標(biāo)有線狀目標(biāo)(如橋、立交橋等)、團(tuán)狀目標(biāo)(如艦艇、車輛)、復(fù)合目標(biāo)(港口、機(jī)場、油庫),下圖顯示了遙感影像中的常見目標(biāo),目標(biāo)由紅色圓框或方框圈中標(biāo)出。 橋 立交橋 機(jī)場 油罐 網(wǎng)球場 飛機(jī) 復(fù)合目標(biāo)示例 目在目標(biāo)檢測研究領(lǐng)域中,目標(biāo)檢測框架需要判斷圖像中是否含有目標(biāo),并且得到目標(biāo)在圖像中的位置,檢測結(jié)果通常使用包圍目標(biāo)的矩形框來表示,如下圖所示。目標(biāo)識別是在目標(biāo)檢測的基礎(chǔ)上,對目標(biāo)的特性進(jìn)行分析,如識別出飛機(jī)目標(biāo)的具體型號等。 目標(biāo)檢測示例 目標(biāo)檢測方法分類基于高分辨率遙感進(jìn)行目標(biāo)檢測的研究中,遙感影像目標(biāo)檢測方法可以分為4大類,分別是基于模板匹配、特定知識、面向?qū)ο?、機(jī)器學(xué)習(xí)的方法。
基于模板匹配(Template matching-based)的方法是最早也是最直觀、簡單的方法。在模板匹配的對象檢測框架中有兩個主要步驟,如下圖所示:模板生成、相似性度量。模板通常來源于人工描畫或者搜集,之后將模板與待檢測圖像進(jìn)行相似性度量,輸出檢測結(jié)果。最常見的模板度量方法是絕對差異的總和、差的平方和、歸一化互相關(guān)系數(shù)和歐氏距離?;谀0迤ヅ涞哪繕?biāo)檢測方法按照模板的靈活程度分為剛性模板匹配和變形模板匹配?;谀0迤ヅ涞姆椒ㄔ砗唵?,但是對視角變化敏感,需要設(shè)計模板,計算量大。 基于模板匹配的方法一般流程
基于特定知識的方法(Knowledge-based)一般通過建立各種知識和規(guī)則,將目標(biāo)檢測問題轉(zhuǎn)化為假設(shè)檢驗問題,這里的知識包括遙感影像地理學(xué)相關(guān)知識、上下文知識等,一般步驟如圖3.4所示。基于特定知識的方法方法需要根據(jù)先驗知識定制規(guī)則,不易把握,如果規(guī)則過于嚴(yán)格,會導(dǎo)致目標(biāo)漏檢,如果過于寬松,檢測結(jié)果會出現(xiàn)虛警,并且需要針對特定的目標(biāo)制定規(guī)則,檢測方法不具備普適性。 基于特定知識的方法一般流程
近年來,隨著越來越多的亞米級圖像廣泛應(yīng)用,基于對象的圖像分析已成為一種新的方法,該方法通過分割算法將遙感影像轉(zhuǎn)換成有意義的對象。面向?qū)ο蟮姆椒ǎ∣bject-based)的步驟如圖3.5所示,主要包括圖像分割與分類。首先,通過圖像分割方法將圖像分割成互不相通勻質(zhì)的區(qū)域,每個區(qū)域稱為對象。然后對這些對象進(jìn)行分類。基于對象的方法克服了傳統(tǒng)的基于像素的圖像分類方法的局限性,為目標(biāo)檢測提供了一個完整的框架,并已成功地應(yīng)用于滑坡檢測、土地覆蓋與土地利用、變化檢測中?;趯ο蟮姆椒ǖ碾y點在于分割過程中,容易產(chǎn)生過分割的現(xiàn)象,而定義分類規(guī)則的專家知識仍然依賴主觀經(jīng)驗。 面向?qū)ο蟮姆椒ㄒ话懔鞒?/p>
隨著近年來機(jī)器學(xué)習(xí)方法研究的興起,越來越多的研究者們將目標(biāo)檢測任務(wù)轉(zhuǎn)化為機(jī)器學(xué)習(xí)中的分類問題。根據(jù)目標(biāo)候選框的4個坐標(biāo)是否參與訓(xùn)練和更新,本文將基于機(jī)器學(xué)習(xí)的方法分為基于離線學(xué)習(xí)和在線測試的方法和基于深度學(xué)習(xí)特征的方法: ①基于離線學(xué)習(xí)和在線測試的方法。最具代表的方法有基于HOG特征與SVM的行人檢測框架。“離線”指分類器的參數(shù)在測試之前就需要完成訓(xùn)練,并且正負(fù)樣本都是確定的,在測試階段并不加入候選框的4個坐標(biāo)微調(diào)。如下圖所示,整個檢測包括兩個階段,離線訓(xùn)練階段的任務(wù)是訓(xùn)練出分類器。在線測試階段,對測試圖像產(chǎn)生目標(biāo)候選區(qū)域,然后使用上一階段訓(xùn)練出來的分類器進(jìn)行預(yù)測。因此大多數(shù)目標(biāo)檢測方法沿著3個方向進(jìn)行:1)根據(jù)需求選擇或者提出不同的候選框產(chǎn)生方法;2)使用或者提出各種特征提取方法;3)使用不同的分類器進(jìn)而提高檢測精度。 基于離線學(xué)習(xí)和在線測試方法目標(biāo)檢測流程 ②基于深度學(xué)習(xí)特征的方法,該類方法可以大致分為兩類: 1)RCNN系列。2015年,Ross B等人提出了基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region-based Convolutional Neural Network,RCNN)的目標(biāo)檢測方法,將深度學(xué)習(xí)方法引入到目標(biāo)檢測領(lǐng)域,大幅度提升了目標(biāo)檢測精度。接著該課題組又提出了效率更佳的Fast-RCNN、Faster-RCNN。RCNN系列因此成為目前目標(biāo)檢測的主流方法,RCNN系列需要先產(chǎn)生候選框建議區(qū)域,再進(jìn)行網(wǎng)絡(luò)訓(xùn)練。 2)基于回歸的方法。RCNN系列在計算速度方面已經(jīng)取得了很大進(jìn)展,但不能進(jìn)行實時的檢測。后來,以YOLO(You Only Look Once)和SSD(Single Shot MultiBox Detector)為代表的基于回歸的方法被提出。YOLO和SSD可以直接從圖片中以回歸方式的確定目標(biāo)的位置和類別,這類方法具有實時性,但精度不如RCNN系列,非常適合視頻中目標(biāo)的檢測。 基于離線學(xué)習(xí)和在線測試的方法的優(yōu)點是時間快,分類器參數(shù)通常經(jīng)過一次或數(shù)次迭代就可以得到。但是這種方法得到的檢測框往往是不精確的?;谏疃葘W(xué)習(xí)的方法,可以自動地學(xué)習(xí)到分類模型,并且模型有可擴(kuò)展性和兼容性,具有較高的檢測精度,常見于視頻中動態(tài)目標(biāo)檢測,檢測框與目標(biāo)的邊界貼合程度高。目前基于深度學(xué)習(xí)的目標(biāo)檢測方法已經(jīng)成為研究主流。 在深度學(xué)習(xí)興起并逐漸成為計算機(jī)視覺的核心方法之后,基于深度學(xué)習(xí)算法的一系列目標(biāo)檢測算法大致可以分為兩大流派:兩步走(two-stage)算法和一步走(one-stage)算法。 兩步算法(two-stage):先產(chǎn)生候選區(qū)域然后再進(jìn)行CNN分類(RCNN系列),主要經(jīng)歷了: R-CNN—SPP-Net—Fast R-CNN—Faster R-CNN—Mask R-CNN 一步算法(one-stage):直接對輸入圖像應(yīng)用算法并輸出類別和相應(yīng)的定位(yolo系列),主要歷經(jīng)了: YOLO v1—SSD—YOLO v2/YOLO 9000—YOLO v3—YOLO v4 無論是兩步走還是一步走算法,它們都是在識別的快和準(zhǔn)兩點上尋找一個平衡點和或者極端點。要么準(zhǔn)要么快,但隨著深度學(xué)習(xí)和計算機(jī)視覺的向前發(fā)展,既快又準(zhǔn)的算法也在逐漸的實現(xiàn)當(dāng)中。 |
|
來自: taotao_2016 > 《AI》