圖像邊緣檢測技術(shù)的實(shí)現(xiàn)及應(yīng)用
Edge is the most basic feature of images, so edge detection is an important content of image processing. In the past decades, the rapid development of the theory of wavelet has brought new theory and method for image processing. As wavelet transform has good local quality and multi-scale identity, it can satisfy the need of edge detection in multi-scales. Detecting edge using wavelet transform is recognized an efficient way.
This thesis first introduces several current widely used edge detection algorithm such as Sobel, Roberts, Laplacian. The core idea of these algorithms is that the edge points correspond to the local maximal points of original image’s gray-level gradient. We perform all experiments based on these widely used edge detection algorithm under the Visual C++ environment, However, when there are noises in images, these algorithms are very sensitive to noises, and may detect noise points as marginal points, and the real edge may not be detected because of the noises’ interference. The general idea of edge detection using wavelet transform is: choose a kind of suitable wavelet function, use the function to transform images in multi-scale, detect the wavelet transform module local maximum and gain the image edge. We perform the experiments based on wavelet transform under the MATLAB environment, the results indicate that these methods are effective. Moreover, we analysis the advantages and shortcomings of these methods.
human face detection is the base of human face recognition. At the last chapter the experiment results are used to confirm the different methods which are employed to test the edge detection results of the human face image. It discusses the possible factors, which makes the different results. Finally, it introduced the application of the edge detection in human face detection and recognition.
KEY WORDS: edge detection,wavelet transform,human face recognition,human face detection
目錄
摘要 II
ABSTRACT III
第一章 緒論 4
1.1邊緣與邊緣檢測 4
1.2邊緣檢測的研究背景及意義 1
1.3課題發(fā)展現(xiàn)狀 3
1.4論文結(jié)構(gòu) 5
第二章 經(jīng)典的邊緣檢測方法及實(shí)現(xiàn) 7
2.1基于梯度的邊緣檢測方法 7
2.1.1Roberts算子 8
2.1.2Prewitt算子 8
2.1.3Sobel算子 8
2.1.4Kirsch算子 9
2.2拉普拉斯邊緣檢測算子 10
2.3高斯拉普拉斯邊緣檢測算子 11
2.4經(jīng)典邊緣檢測算子的設(shè)計(jì)及實(shí)驗(yàn)結(jié)果分析比較 13
2.4.1經(jīng)典的邊緣檢測算子的實(shí)現(xiàn)步驟 13
2.4.2經(jīng)典算子的Visual C++實(shí)現(xiàn)及結(jié)果比較 15
第三章 小波變換的邊緣檢測方法及實(shí)現(xiàn) 17
3.1引言 17
3.2小波的來源 18
3.3小波變換簡介 20
3.3.1小波變換定義 20
3.3.2連續(xù)的小波變換 20
3.3.3離散小波變換 20
3.3.4二維小波變換 21
3.4小波變換邊緣檢測的設(shè)計(jì)和實(shí)現(xiàn) 21
3.4.1小波變換邊緣檢測的優(yōu)點(diǎn) 21
3.4.2小波變換模局部極大值邊緣檢測的原理和步驟 22
3.4.3小波邊緣檢測的實(shí)驗(yàn)結(jié)果比較 25
第四章 邊緣檢測在人臉識別中的應(yīng)用 26
4.1生物識別技術(shù) 26
4.2人臉識別技術(shù)研究的背景及意義 26
4.3 人臉檢測的程序?qū)崿F(xiàn)界面 27
4.4 不同算法實(shí)現(xiàn)人臉檢測及其結(jié)果分析 29
第五章 結(jié)論與展望 34
參考文獻(xiàn) 35
致謝 37
附錄 38
摘要
邊緣是圖像最基本的特征,因而邊緣檢測是圖像處理中的重要內(nèi)容。近十幾年來,迅速發(fā)展起來的小波理論為圖像處理帶來了新的理論和方法,由于小波變換的良好局部特性與多尺度特性,可以滿足在多個(gè)尺度上提取邊緣的需要,所以應(yīng)用小波變換提取邊緣被認(rèn)為是一種有效、有前途的方法。
本文首先介紹了幾種目前廣泛使用的經(jīng)典的邊緣檢測方法如 Sobel、Roberts 和Laplacian 等。這些算法的核心思想是假設(shè)邊緣點(diǎn)對應(yīng)于原始圖像灰度級梯度的局部極值點(diǎn)。然后在Visual C++環(huán)境下對這些算子進(jìn)行編程實(shí)現(xiàn)。但是,當(dāng)圖像含有噪聲時(shí),這些算法對噪聲非常敏感,常常會把噪聲當(dāng)作邊緣點(diǎn)檢測出來,而真正的邊緣由于噪聲的干擾也可能被漏檢。其次介紹了利用小波變換進(jìn)行邊緣檢測的方法,其主要思想是:選擇合適的小波函數(shù)對圖像進(jìn)行多尺度小波變換,檢測小波變換模的局部極大值。并在 Matlab 環(huán)境下對基于小波變換邊緣檢測進(jìn)行了試驗(yàn)。在此基礎(chǔ)上,分析了經(jīng)典邊緣檢測方法和基于小波變換方法的優(yōu)缺點(diǎn)。
人臉邊緣檢測是人臉識別的基礎(chǔ)。最后一章通過試驗(yàn)驗(yàn)證各種檢測方法在人臉圖像中對邊緣的檢測效果,并討論不同因素影響下邊緣檢測的效果。最后介紹了人臉邊緣檢測在人臉檢測和識別中的具體應(yīng)用。
關(guān)鍵詞:邊緣檢測,小波變換,人臉識別,人臉檢測
ABSTRACT
第一章 緒論
1.1邊緣與邊緣檢測
邊緣(edge)是指圖像局部強(qiáng)度變化最顯著的部分。邊緣主要存在于目標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要基礎(chǔ)。圖像分析和理解的第一步常常是邊緣檢測【1】(edge detection)。由于邊緣檢測十分重要,因此成為機(jī)器視覺研究領(lǐng)域最活躍的課題之一。
圖像中的邊緣通常與圖像強(qiáng)度或圖像強(qiáng)度的一階導(dǎo)數(shù)的不連續(xù)性有關(guān)。圖像強(qiáng)度的不連續(xù)可分為:(1)階躍不連續(xù),即圖像強(qiáng)度在不連續(xù)處的兩邊的像素灰度值有著顯著的差異;(2)線條不連續(xù),即圖像強(qiáng)度突然從一個(gè)值變化到另一個(gè)值,保持一個(gè)較小的行程后又返回到原來的值。在實(shí)際中,階躍和線條邊緣圖像是很少見的,由于大多數(shù)傳感元件具有低頻特性,使得階躍邊緣變成斜坡型邊緣,線條邊緣變成屋頂形邊緣,其中的強(qiáng)度變化不是瞬間的,而是跨越一定的距離,這些邊緣如圖1.1所示:
(1) (2)
圖1.1 兩種常見的邊緣,(1)階躍函數(shù),(2)線條函數(shù)
對一個(gè)邊緣來說,有可能同時(shí)具有階躍和線條邊緣特性。例如在一個(gè)表面上,由一個(gè)平面變化到法線方向不同的另一個(gè)平面就會產(chǎn)生階躍邊緣;如果這一表面具有鏡面反射特性且兩平面形成的棱角比較圓滑,則當(dāng)棱角圓滑表面的法線經(jīng)過鏡面反射角時(shí),由于鏡面反射分量,在棱角圓滑表面上會產(chǎn)生明亮光條,這樣的邊緣看起來象在階躍邊緣上疊加了一個(gè)線條邊緣。由于邊緣可能與場景中物體的重要特征對應(yīng),所以它是很重要的圖像特征。比如,一個(gè)物體的輪廓通常產(chǎn)生階躍邊緣,因?yàn)槲矬w的圖像強(qiáng)度不同于背景的圖像強(qiáng)度。
1.2邊緣檢測的研究背景及意義
圖像中包含了人類所需要的感知世界,進(jìn)而認(rèn)識世界、改造世界的大部分信息量。圖像處理【2】就是對圖像信息進(jìn)行加工處理,以滿足人的視覺心理和實(shí)際應(yīng)用的要求,理解圖像、識別圖像中的目標(biāo)是計(jì)算機(jī)視覺圖像處理的中心任務(wù)。
邊緣像素實(shí)質(zhì)上是指局部圖像范圍內(nèi)灰度的急劇變化(奇異點(diǎn)),圖像邊緣就是二維圖像中奇異點(diǎn)的集合。物體形狀、物體邊界、位置遮擋、陰影輪廓及表面紋理等重要視覺信息在圖像中均有邊緣產(chǎn)生。圖像邊緣是圖像中最基本的特征,是分析理解圖像的基礎(chǔ)。邊緣檢測對于物體識別也是很重要的。因?yàn)?(1)人眼通過追蹤未知物體的輪廓而掃視一個(gè)未知的物體;(2)得到圖像的邊緣,能使圖像分析大大簡化;(3)很多圖像并沒有具體的物體,對于這些圖像的理解取決于它們的紋理性質(zhì),而提取這些紋理性質(zhì)與邊緣檢測有極其密切的關(guān)系。所以邊緣檢測使數(shù)字圖像分析處理的前提,檢測結(jié)果的優(yōu)劣影響著下一步圖像壓縮、計(jì)算機(jī)視覺、模式識別的應(yīng)用,所以對它的研究具有現(xiàn)實(shí)意義和理論意義。
1.邊緣檢測對圖像數(shù)據(jù)壓縮的影響
在圖像科學(xué)研究中,大量工作是對圖像、圖形的處理,包括數(shù)字圖像的處理、儲存、傳輸?shù)取L貏e地,多媒體技術(shù)、計(jì)算機(jī)視覺和計(jì)算機(jī)模式識別已經(jīng)越來越普遍地應(yīng)用于人們的生活當(dāng)中。其技術(shù)特點(diǎn)要求信息的交互性、實(shí)時(shí)性和協(xié)同性。從圖像處理的現(xiàn)狀及數(shù)據(jù)存儲傳輸理論知道,多媒體應(yīng)用中的關(guān)鍵技術(shù)是圖形、圖像數(shù)據(jù)的壓縮和編碼以減少數(shù)據(jù)存儲量、降低數(shù)據(jù)傳輸率,滿足各行各業(yè)對圖像處理的要求。
圖像信息是可以進(jìn)行壓縮的,因?yàn)樵紨?shù)據(jù)存在著大量的冗余信息,同時(shí)人的視覺具有”掩蓋效應(yīng)”,所以在圖像傳輸時(shí)可以對某些信息進(jìn)行一定程度上的丟失,以達(dá)到較大的壓縮比。對圖像中物體的邊緣檢測能夠提取物體的關(guān)鍵特征或輪廓,可以用較少的比特?cái)?shù)表示圖像,達(dá)到壓縮圖像數(shù)據(jù)的目的。
2.邊緣檢測對模式識別的影響
人工智能領(lǐng)域中,計(jì)算機(jī)視覺十分關(guān)注開發(fā)分析圖像內(nèi)容的算法,其中統(tǒng)計(jì)模式識別時(shí)應(yīng)用最為廣泛的方法,用數(shù)字圖像處理技術(shù)可以很好地實(shí)現(xiàn)模式識別。給定一幅含有多個(gè)物體的數(shù)字圖像,模式識別過程主要有三個(gè)階段組成:
(1)圖像分割或圖像分離。檢測出各個(gè)物體,并與其它景物分離。
(2)特征抽取。對物體進(jìn)行度量并形成一組N維特征。
(3)分類。輸出一種決策,確定物體應(yīng)歸屬的類別。
只有精確的圖像邊緣檢測才能真正實(shí)現(xiàn)機(jī)器人視覺及圖像測量、衛(wèi)星遙感技術(shù)、精確制導(dǎo)等技術(shù)。
在數(shù)字識別系統(tǒng)中,圖像邊緣提取占據(jù)著重要的地位,它位于系統(tǒng)的最底層,為其他模塊所依賴。圖像邊緣提取作為計(jì)算機(jī)視覺領(lǐng)域最經(jīng)典的的研究課題長期受到人們的重視。經(jīng)典的邊緣檢測算法有Sobel、Roberts、Prewitt、拉普拉斯和LOG邊緣檢測方法等。近年來仍有許多學(xué)者不斷提出新的理論和方法,可見參考文獻(xiàn)[3],學(xué)術(shù)思想活躍,這一方面反映了課題本身的重要性,另一方面也反映了這個(gè)課題的深度和難度。
1.3課題發(fā)展現(xiàn)狀
圖像的邊緣檢測有著很長的研究歷史,學(xué)術(shù)思想非常活躍,新理論、新方法不斷涌現(xiàn),一直是國內(nèi)外圖像處理領(lǐng)域研究的熱點(diǎn),目前為止已經(jīng)提出了許多方法和理論,對該領(lǐng)域相關(guān)研究的回顧請見參考文獻(xiàn)[4]。這一方面是由于邊緣檢測本身的重要性,另一方面也反映了邊緣檢測課題的深度和難度。至今提出的關(guān)于邊緣檢測的方法和理論尚存在不足之處,在某些具體情況下仍然無法很好的檢測出目標(biāo)物體的邊緣,難以找到一種普遍適應(yīng)性的邊緣檢測方法。因此,根據(jù)具體的應(yīng)用要求設(shè)計(jì)新的邊緣檢測方法,或?qū)ΜF(xiàn)有的方法進(jìn)行改進(jìn)以得到滿意的邊緣檢測結(jié)果,這些依然是研究的主流方向。
現(xiàn)有的邊緣檢測方法大致有以下幾類【5】:
1.微分法
傳統(tǒng)的圖像邊緣檢測方法大多歸結(jié)為圖像高頻分量的增強(qiáng)過程,微分運(yùn)算自然就成了邊緣檢測與提取的主要手段。基于邊緣點(diǎn)往往對應(yīng)于一階微分幅值大的點(diǎn),研究者最早提出了一些基于梯度的邊緣檢測算子【6】,例如Roberts算子、Prewitt算子、Sobel算子、Kirsch算子等?;谔荻鹊倪吘墮z測算子是現(xiàn)在應(yīng)用比較廣泛的方法,它們運(yùn)算量小,操作簡單。但是由于基于梯度的邊緣檢測算子通常在圖像邊緣附近的區(qū)域內(nèi)產(chǎn)生較寬的響應(yīng),所以采用上述算子檢測的邊緣一般需要作細(xì)化處理,這就影響了邊緣定位的精度。一階微分的局部最大值對應(yīng)著二階微分的過零點(diǎn),這意味著在圖像邊緣點(diǎn)處有一階微分的峰值同樣會有二階微分的零交叉點(diǎn),因此人們也提出了二階微分算子進(jìn)行邊緣檢測,例如拉普拉斯算子。與基于梯度的邊緣檢測算子相比,拉普拉斯算子對噪聲更加敏感,增強(qiáng)了噪聲對圖像的影響。實(shí)際應(yīng)用中使用基于梯度和二階微分的邊緣檢測算子時(shí),通常需要先對圖像進(jìn)行濾波平滑處理。
2.最優(yōu)算子法
最優(yōu)算子是在經(jīng)典邊緣檢測算子的基礎(chǔ)上發(fā)展起來的,這類方法的目的是根據(jù)信噪比求得檢測邊緣的最優(yōu)濾波器。Marr- Hildreth算子【7】,也被稱LOG( Laplacian of Gaussian)算子,它先用高斯函數(shù)對圖像進(jìn)行平滑,再采用拉普拉斯算子根據(jù)二階導(dǎo)數(shù)過零點(diǎn)檢測邊緣。數(shù)學(xué)上已經(jīng)證明【8】。LOG算子是按照二階導(dǎo)數(shù)零交叉點(diǎn)檢測階躍型邊緣的最佳算子。
3.基于小波的邊緣檢測
通過小波多尺度提取圖像邊緣是一種非常有效的方法。由于小波變換具有的多尺度特性,圖像的每個(gè)尺度的小波變換都提供了一定的邊緣信息。當(dāng)尺度小時(shí), 圖像的邊緣細(xì)節(jié)信息較為豐富,邊緣定位精度較高,但易受到噪聲的干擾;大尺度時(shí),圖像的邊緣穩(wěn)定,抗噪性好,但定位精度差。將各尺度的邊緣圖像的結(jié)果綜合起來,發(fā)揮大小尺度的優(yōu)勢,就能得到精確的圖像。
多尺度邊緣檢測的基本思想就是沿梯度方向,分別用幾個(gè)不同尺度的邊緣檢測算子在相應(yīng)點(diǎn)上檢測模極大值的變換情況,并通過對閾值的選取,再在不同尺度上進(jìn)行綜合,得到最終邊緣圖像,可以較好的解決噪聲和定位精度之間的矛盾。
4.基于形態(tài)學(xué)的邊緣檢測
數(shù)學(xué)形態(tài)學(xué)是一種非線性濾波方法,在圖像處理中已獲得了廣泛的應(yīng)用。形態(tài)學(xué)運(yùn)算是物體形狀集合與結(jié)構(gòu)元素之間的相互作用,對邊緣方向不敏感,并能在很大程度上抑制噪聲和探測真正的邊緣。同時(shí)數(shù)學(xué)形態(tài)學(xué)在圖像處理方面還具有直觀上的簡單性和數(shù)學(xué)上的嚴(yán)謹(jǐn)性,在描述圖像中物體形狀特征上具有獨(dú)特的優(yōu)勢。因此,將數(shù)學(xué)形態(tài)學(xué)用于邊緣檢測,既能有效地濾除噪聲,又可保留圖像中的原有細(xì)節(jié)信息,具有較好的邊緣檢測效果。
用數(shù)學(xué)形態(tài)學(xué)運(yùn)算進(jìn)行邊緣檢測也存在著一定的不足,比如結(jié)構(gòu)元素單一的問題。它對與結(jié)構(gòu)元素同方向的邊緣敏感,而與其不同方向的邊緣或噪聲會被平滑掉, 即邊緣的方向可以由結(jié)構(gòu)元素的形狀確定。但如果采用對稱的結(jié)構(gòu)元素,又會減弱對圖像邊緣的方向敏感性。所以在邊緣檢測中,可以考慮用多方位的形態(tài)結(jié)構(gòu)元素, 運(yùn)用不同的結(jié)構(gòu)元素的邏輯組合檢測出不同方向的邊緣。梁勇等人構(gòu)造的8個(gè)方向的多方位形態(tài)學(xué)結(jié)構(gòu)元素,應(yīng)用基本形態(tài)運(yùn)算,得到8個(gè)方向的邊緣檢測結(jié)果,再把這些結(jié)果進(jìn)行歸一化運(yùn)算、加權(quán)求和,得到最終的圖像邊緣。該算法在保持圖像細(xì)節(jié)特征和平滑邊緣等方面,取得了很好的效果。
將模糊集合理論用于數(shù)學(xué)形態(tài)學(xué)就形成了模糊形態(tài)學(xué)。模糊形態(tài)學(xué)是傳統(tǒng)形態(tài)學(xué)從二值邏輯向模糊邏輯的推廣,與傳統(tǒng)數(shù)學(xué)形態(tài)學(xué)有相似的計(jì)算結(jié)果和相似的代數(shù)特性。Todd 和Hirohisa 將模糊形態(tài)學(xué)推廣到了邊緣檢測領(lǐng)域。目前,數(shù)學(xué)形態(tài)學(xué)在理論上已趨于完備,與實(shí)際應(yīng)用相結(jié)合,使之能用于實(shí)時(shí)處理將是今后發(fā)展的一個(gè)重要方向。
5.基于分形理論的邊緣檢測
任意一幅圖像都是有灰度的、非嚴(yán)格自相似的,不具有整體與局部的自相似,但卻存在局部之間的自相似,即從局部上存在一定程度近似的分形結(jié)構(gòu)。正是由于存在局部之間的相似性,就可以構(gòu)造圖像的迭代函數(shù)。分形幾何中的壓縮映射定理,可以保證局部迭代函數(shù)的收斂,而分形幾何中的拼貼定理,就允許一個(gè)完整圖像分成若干個(gè)分形結(jié)構(gòu),即構(gòu)成一個(gè)迭代函數(shù)系統(tǒng)。有了這個(gè)迭代函數(shù)系統(tǒng),就必然決定了唯一的分形圖形。這個(gè)圖形被稱為迭代函數(shù)系統(tǒng)的吸引子。因此壓縮映射定理和拼貼定理,構(gòu)成了分形在圖像處理中的核心部分。
對于給定的一幅圖像,尋找一個(gè)迭代函數(shù)系統(tǒng),使它的吸引子與原圖像盡量地吻合,因?yàn)榈瘮?shù)系統(tǒng)的吸引子與原圖像間必然存在著差異,圖像中的每個(gè)子圖分形結(jié)構(gòu)也不同程度上存在差異,因此子圖的分形失真度大小不一,處在邊緣區(qū)的子圖的分形失真度比較大,而處在平坦區(qū)或紋理區(qū)子圖的分形失真度相對比較小。因此,就可以利用圖像邊緣在分形中的這一性質(zhì)來提取圖像的邊緣。在檢測圖像邊緣時(shí),采用某種度量方法( 如最小二乘法) 測量子塊與最佳匹配父塊的失真度,當(dāng)計(jì)算的失真度值越大時(shí),對應(yīng)的邊緣塊越強(qiáng),否則,對應(yīng)的邊緣塊越弱。設(shè)定某一閾值,作為區(qū)分邊緣塊的界限,與最佳匹配父塊的失真度大于閾值的子塊,就被劃為邊緣塊。
6.基于模糊學(xué)的邊緣檢測
80 年代中期,Pal和 King 等人提出了一種圖像邊緣檢測模糊算法【9】,首次將模糊集理論引入到圖像的邊緣檢測算法中,能有效地將物體從背景中分離出來,并在模式識別和醫(yī)療圖像處理中獲得了良好的應(yīng)用。該算法的思想是首先用隸屬度函數(shù) G 將圖像映射成一個(gè)模糊隸屬度矩陣,然后對該矩陣進(jìn)行多次非線性變換,以增強(qiáng)邊緣信息,削弱非邊緣信息,再對模糊隸屬度矩陣進(jìn)行 G-1變換,易得到經(jīng)過增強(qiáng)的圖像,最后用”min”和”max”算子【10】提取邊緣。該算法也存在一些缺陷,比如損失了一些低灰度值邊緣信息,并且運(yùn)算復(fù)雜。
7.基于人工智能的邊緣檢測
人工神經(jīng)網(wǎng)絡(luò)是進(jìn)行模式識別的一種重要工具和方法。它需要的輸入知識較少,也比較適合于并行實(shí)現(xiàn)。近年來, 人工神經(jīng)網(wǎng)絡(luò)正廣泛地被用于模式識別、信號與圖像處理、人工智能及自動控制等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)的主要問題是輸入與輸出層的設(shè)計(jì)問題、網(wǎng)絡(luò)數(shù)據(jù)的準(zhǔn)備問題、網(wǎng)絡(luò)權(quán)值的準(zhǔn)備及確定問題、隱層數(shù)及結(jié)點(diǎn)的問題、網(wǎng)絡(luò)的訓(xùn)練問題。在各種神經(jīng)網(wǎng)絡(luò)模型中,應(yīng)用最廣泛的一類是前饋神經(jīng)網(wǎng)絡(luò),用于訓(xùn)練前饋網(wǎng)絡(luò)的最常用的學(xué)習(xí)方法是 BP 算法。目前已有了很多基于 BP 網(wǎng)絡(luò)的邊緣檢測算法,但是 BP 網(wǎng)絡(luò)收斂速度很慢, 容易收斂于局部極小點(diǎn),且數(shù)值穩(wěn)定性差,參數(shù)難以調(diào)整,很難滿足實(shí)際應(yīng)用的要求。
Chua 和 Yang提出用細(xì)胞神經(jīng)網(wǎng)絡(luò)來檢測圖像邊緣,這種方法與傳統(tǒng)方法完全不同,首先將圖像映射為一個(gè)神經(jīng)網(wǎng)絡(luò),每個(gè)像素點(diǎn)是一個(gè)神經(jīng)元,然后通過動態(tài)方程引導(dǎo)神經(jīng)元的狀態(tài)向神經(jīng)網(wǎng)絡(luò)所定義的最低能量方向變化,來實(shí)現(xiàn)邊緣提取。
1.4論文結(jié)構(gòu)
本文的研究工作主要是圖像邊緣檢測技術(shù),其中包括了經(jīng)典的圖像邊緣檢測方法,如Roberts、Sobel、Prewitt和LOG等,還對基于變換的邊緣檢測技術(shù)進(jìn)行重點(diǎn)介紹。
第一章中介紹了論文選題的背景,并詳細(xì)介紹了近年來在圖像邊緣檢測方面的一些方法。
第二章介紹了幾種常用的經(jīng)典邊緣檢測算子,并用Visual C++實(shí)現(xiàn)邊緣檢測并對比檢測結(jié)果,分析了這些方法的不足之處。
第三章介紹了小波變換的理論基礎(chǔ),并在Matlab環(huán)境下利用小波變換模局部極大值進(jìn)行的邊緣檢測的方法實(shí)現(xiàn)圖像邊緣檢測結(jié)果,并比較不同J值時(shí)候的結(jié)果。
第四章主要是邊緣檢測技術(shù)的具體應(yīng)用。介紹對人臉識別技術(shù)的背景,并對程序進(jìn)行了簡介,并用第二章和第三章中提到的邊緣檢測方法對lena進(jìn)行人臉圖像的邊緣檢測,并對結(jié)果進(jìn)行比較。再使用帶噪聲的lena進(jìn)行人臉圖像的邊緣檢測,比較結(jié)果,體現(xiàn)出小波變換實(shí)現(xiàn)邊緣檢測的優(yōu)越性。
第五章是對所做工作的總結(jié)及對未來研究方向的展望。
第二章 經(jīng)典的邊緣檢測方法及實(shí)現(xiàn)
2.1基于梯度的邊緣檢測方法
基于梯度的邊緣檢測算子【11】是圖像處理中最為常用的一階導(dǎo)數(shù)方法。由于邊緣是圖像灰度變化比較劇烈的地方,在灰度突變處求導(dǎo)將產(chǎn)生較大值,因此在數(shù)學(xué)上可用灰度導(dǎo)數(shù)的大小來表示灰度變化。
梯度是一階導(dǎo)數(shù)的二維等效形式,梯度的幅值代表邊緣的強(qiáng)度,梯度的方向與邊緣走向垂直.將圖像f(x,y)在點(diǎn)(x, y)的梯度定義為下列向量:
(2.1)
梯度的幅值由下式給出:
(2.2)
在實(shí)際應(yīng)用中,通常用絕對值來近似梯度幅值:
(2.3)
或 (2.4)
梯度的方向由(2.5)式定義,其中 角是與x軸的夾角。
(2.5)
對于數(shù)字圖像,可用一階差分代替一階導(dǎo)數(shù)進(jìn)行運(yùn)算,最簡單的梯度近似表達(dá)式是:
(2.6)
(2.7)
梯度算子可以用下面的模板表示:
為了提取圖像的邊緣圖,選取適當(dāng)?shù)拈y值T對圖像的梯度值進(jìn)行二值化,則有:
(2.8)
2.1.1Roberts算子
Roberts交叉梯度算子【11】為梯度的計(jì)算提供了一種簡單的近似方法,它采用的是對角方向相鄰兩像素之差:
(2.9)
(2.10)
Roberts梯度算子的卷積模板如下所示:
根據(jù)上面所示的卷積模板和(2.3), (2.4)式就可以計(jì)算圖像的梯度值,再按(2.8)式對圖像的梯度值進(jìn)行二值化,最后得到邊緣圖像。
Roberts算子采用對角線方向相鄰兩像素之差近似梯度幅值檢測邊緣。檢測水平和垂直邊緣的效果好于斜向邊緣,定位精度高,對噪聲敏感。
2.1.2Prewitt算子
為了在檢測圖像邊緣的同時(shí)減少噪聲的影響,Prewitt從加大邊緣檢側(cè)算子的模板大小出發(fā),由2×2模板擴(kuò)大到3×3模板計(jì)算差分算子,將方向差分運(yùn)算與局部平均相結(jié)合,提出了Prewitt算子【11】。 Prewitt算子的表達(dá)式如下:
(2.11)
(2.12)
Prewitt算子的卷積模板如下所示:
2.1.3Sobel算子
Sobel在Prewitt算子的基礎(chǔ)上,在3×3鄰域內(nèi)做加權(quán)平均和差分運(yùn)算,提出Sobel算子【11】。Sobel算子的表達(dá)式如下:
(2.13)
(2.14)
Sobel算子的卷積模板如下所示:
Sobel算子很容易在空間上實(shí)現(xiàn),Sobel邊緣檢測器不但產(chǎn)生較好的邊緣檢測效果,而且受噪聲的影響也比較小。當(dāng)使用大的領(lǐng)域時(shí),抗噪聲特性會更好,但這樣做會增加計(jì)算量,并且得出的邊緣也較粗。
Sobel算子利用像素點(diǎn)上下、左右鄰點(diǎn)的灰度加權(quán)算法,根據(jù)在邊緣點(diǎn)處達(dá)到極值這一現(xiàn)象進(jìn)行邊緣的檢測。Sobel算子對噪聲具有平滑作用,提供較為精確的邊緣方向信息,但它同時(shí)也會檢測出許多的偽邊緣,邊緣定位精度不夠高。當(dāng)對精度要求不是很高時(shí),是一種較為常用的邊緣檢測方法。
Sobel算子與Prewitt算子相比,如果在每個(gè)點(diǎn)噪聲都是相同的,那么Prewitt算子是比較好的;如果靠近邊緣的噪聲是沿著邊緣的2倍,那么Sobel算子是比較好的。也就是算子的好壞取決于噪聲的結(jié)構(gòu)。
事實(shí)上,它們存在一些共同的問題:
(1)他們的結(jié)果對噪聲很敏感,圖像的離散差分對噪聲比對原圖像更敏感;
(2)可以通過先對圖像做平滑以改善結(jié)果,但是又會產(chǎn)生一個(gè)問題:會把一些靠在一起的邊緣平滑掉,而且會影響對邊緣的定位;
(3)用這些模板卷積后得到的邊緣可能是跨躍好幾個(gè)點(diǎn)而不是一個(gè)點(diǎn);為了改善這個(gè)問題,還要做一些改進(jìn):邊緣像素不只是要大于閥值,而且在梯度方向上梯度的大小要大于它的前者和它的后者,這個(gè)方法稱之為非極值抑制。
2.1.4Kirsch算子
Kirsch是利用一組模板對圖像中的同一象素求卷積,選取其中的最大值作為邊緣強(qiáng)度,而將與之對應(yīng)的方向作為邊緣方向,常用的八方向 卷積模板如下所示,各方向間的夾角為45度【11】。
2.2拉普拉斯邊緣檢測算子
前面討論了計(jì)算一階導(dǎo)數(shù)的梯度邊緣檢測器,如果所求的一階導(dǎo)數(shù)高于某一閾值,則確定該點(diǎn)為邊緣點(diǎn)。這樣做會導(dǎo)致檢測的邊緣點(diǎn)太多。一種更好的方法就是求梯度局部最大值對應(yīng)的點(diǎn),并認(rèn)定它們是邊緣點(diǎn),如圖2.1所示:在圖2.1中,若用閾值來進(jìn)行邊緣檢測,則在a和b之間的所有點(diǎn)都被記為邊緣點(diǎn)。但通過去除一階導(dǎo)數(shù)中的非局部最大值,可以檢測出更精確的邊緣。一階導(dǎo)數(shù)的局部最大值對應(yīng)著二階導(dǎo)數(shù)的零交點(diǎn)這意味著在邊緣點(diǎn)處有一階導(dǎo)數(shù)的峰值,同樣地,有二階導(dǎo)數(shù)的零交叉點(diǎn)。這樣,通過找圖像強(qiáng)度的二階導(dǎo)數(shù)的零交叉點(diǎn)就能找到邊緣點(diǎn)。
在二維空間,對應(yīng)二階導(dǎo)數(shù)有兩種算子:拉普拉斯算子和二階方向?qū)?shù)。我們在這里只用拉普拉斯算子【11】。
圖2.1 用閾值進(jìn)行邊緣檢測和用二階導(dǎo)數(shù)的零交點(diǎn)進(jìn)行邊緣檢測示意圖
平滑過的階躍邊緣二階導(dǎo)數(shù)是一個(gè)在邊緣點(diǎn)處過零的函數(shù)(見圖2.1)。拉普拉斯算子是二階導(dǎo)數(shù)的二維等效式。函數(shù) 的拉普拉斯算子公式為:
(2.14)
使用差分方程對 和 方向上的二階偏導(dǎo)數(shù)近似如下:
(2.15)
這一近似式是以點(diǎn) 為中心的。用 替換 ,得到:
(2.16)
它是以點(diǎn) 為中心的二階偏導(dǎo)數(shù)的理想近似式,類似地,
(2.17)
把這兩個(gè)式子合并為一個(gè)算子,就成為下面能用來近似拉普拉斯算子的模板:
有時(shí)希望鄰域中心點(diǎn)具有更大的權(quán)值,比如下面的模板就是一種基于這種思想的近似拉普拉斯算子:
當(dāng)拉普拉斯算子輸出出現(xiàn)過零點(diǎn)時(shí)就表明有邊緣存在,其中忽略無意義的過零點(diǎn)(均勻零區(qū))。原則上,過零點(diǎn)的位置精度可以通過線性內(nèi)插方法精確到子像素分辨率,不過由于噪聲,結(jié)果可能不會很精確。
2.3高斯拉普拉斯邊緣檢測算子
利用圖像強(qiáng)度二階導(dǎo)數(shù)的零交叉點(diǎn)來求邊緣點(diǎn)的算法對噪聲十分敏感,所以,希望在邊緣增強(qiáng)前濾除噪聲。 Marr和Hildreth【12】將高斯濾波和拉普拉斯邊緣檢測結(jié)合在一起,形成LOG(Laplacian of Gaussian, LOG)算法,也稱之為拉普拉斯高斯算法。LOG邊緣檢測器的基本特征是【13】:
(1)平滑濾波器是高斯濾波器。
(2)增強(qiáng)步驟采用二階導(dǎo)數(shù)(二維拉普拉斯函數(shù))。
(3)邊緣檢測判據(jù)是二階導(dǎo)數(shù)零交叉點(diǎn)并對應(yīng)一階導(dǎo)數(shù)的較大峰值。
(4)使用線性內(nèi)插方法在子像素分辨率水平上估計(jì)邊緣的位置。
這種方法的特點(diǎn)是圖像首先與高斯濾波器進(jìn)行卷積,這一步既平滑了圖像又降低了噪聲,孤立的噪聲點(diǎn)和較小的結(jié)構(gòu)組織將被濾除。由于平滑會導(dǎo)致邊緣的延展,因此邊緣檢測器只考慮那些具有局部梯度最大值的點(diǎn)為邊緣點(diǎn).這一點(diǎn)可以用二階導(dǎo)數(shù)的零交叉點(diǎn)來實(shí)現(xiàn)。拉普拉斯函數(shù)用作二維二階導(dǎo)數(shù)的近似,是因?yàn)樗且环N無方向算子。為了避免檢測出非顯著邊緣,應(yīng)選擇一階導(dǎo)數(shù)大于某一閾值的零交叉點(diǎn)作為邊緣點(diǎn)。
LOG算子的輸出 是通過卷積運(yùn)算得到的:
(2.18)
根據(jù)卷積求導(dǎo)法有
(2.19)
其中:
(2.20)
稱之為墨西哥草帽算子(見圖2.2)。這樣,下面兩種方法在數(shù)學(xué)上是等價(jià)的:
(1)求圖像與高斯濾波器卷積,再求卷積的拉普拉斯變換。
(2)求高斯濾波器的拉普拉斯變換,再求與圖像的卷積。
圖2.2 一維和二維高斯函數(shù)的拉普拉斯變換圖的翻轉(zhuǎn)圖,其中σ=2
如果采用第一種方法,就可能用到高斯平滑濾波器。直接實(shí)現(xiàn)LOG算法的典型模板見圖2.3。
濾波(通常是平滑)、增強(qiáng)、檢測這三個(gè)邊緣檢測步驟對使用LOG邊緣檢測仍然成立,其中平滑是用高斯濾波器來完成的;增強(qiáng)是將邊緣轉(zhuǎn)換成零交叉點(diǎn)來實(shí)現(xiàn)的;邊緣檢測則是通過檢測零交叉點(diǎn)來進(jìn)行的。
可以看到,零交叉點(diǎn)的斜率依賴于圖像強(qiáng)度在穿過邊緣時(shí)的變化對比度。剩下的問題是把那些由不同尺度算子檢測到的邊緣組合起來。在上述方法中,邊緣是在特定的分辨下得到的。為了從圖像中得到真正的邊緣,有必要把那些通過不同尺度算子得到的信息組合起來。
圖2.3 拉普拉斯高斯模板
2.4經(jīng)典邊緣檢測算子的設(shè)計(jì)及實(shí)驗(yàn)結(jié)果分析比較
2.4.1經(jīng)典的邊緣檢測算子的實(shí)現(xiàn)步驟
經(jīng)典邊緣檢測算法一般有如下四個(gè)步驟,其算法流程圖如圖2.4所示:
步驟一:濾波;邊緣檢測算法主要是基于圖像強(qiáng)度的一階和二階導(dǎo)數(shù),但導(dǎo)數(shù)的計(jì)算對噪聲很敏感,因此必須使用濾波器來改善與噪聲有關(guān)的邊緣檢測器的性能。需要指出,大多數(shù)濾波器在降低噪聲的同時(shí)也導(dǎo)致了邊緣強(qiáng)度的損失,因此,增強(qiáng)邊緣和降低噪聲之間需要折衷。
步驟二:增強(qiáng);增強(qiáng)邊緣的基礎(chǔ)是確定圖像各點(diǎn)鄰域強(qiáng)度的變化值。增強(qiáng)算法可以將鄰域(或局部)強(qiáng)度值有顯著變化的點(diǎn)突顯出來。邊緣增強(qiáng)一般是通過計(jì)算梯度幅值來完成的。
步驟三:檢測;在圖像中有許多點(diǎn)的梯度幅值比較大,而這些點(diǎn)在特定的應(yīng)用領(lǐng)域中并不都是邊緣,所以應(yīng)該用某種方法來確定哪些點(diǎn)是邊緣點(diǎn)。最簡單的邊緣檢測判據(jù)是梯度幅值閾值判據(jù)。
步驟四:定位;如果某一應(yīng)用場合要求確定邊緣位置,則邊緣的位置可在子像素分辨率上來估計(jì),邊緣的方位也可以被估計(jì)出來。
在邊緣檢測算法中,前三個(gè)步驟用得十分普遍。這是因?yàn)榇蠖鄶?shù)場合下,僅僅需要邊緣檢測器指出邊緣出現(xiàn)在圖像某一像素點(diǎn)的附近,而沒有必要指出邊緣的精確位置或方向。邊緣檢測誤差通常是指邊緣誤分類誤差,即把假邊緣判別成邊緣而保留,而把真邊緣判別成假邊緣而去掉。邊緣估計(jì)誤差是用概率統(tǒng)計(jì)模型來描述邊緣的位置和方向誤差的。我們將邊緣檢測誤差和邊緣估計(jì)誤差區(qū)分開,是因?yàn)樗鼈兊挠?jì)算方法完全不同,其誤差模型也完全不同。
圖2.4 經(jīng)典邊緣檢測算子流程圖
2.4.2經(jīng)典算子的Visual C++實(shí)現(xiàn)及結(jié)果比較
(1)一階微分邊緣檢測算子利用梯度最大值或?qū)?yīng)于一階微分幅度最大的方法提取邊界。在算法實(shí)現(xiàn)過程中,通過2×2(Roberts 算子)或者3×3 (其他3種算子)的模塊作為核與圖像中的每個(gè)像素點(diǎn)做卷積和運(yùn)算,然后選取合適的閾值以提取邊緣。在二階微分邊緣檢測算子(拉普拉斯算子)的算法實(shí)現(xiàn)過程中,也是通過3×3 卷積核運(yùn)算,選取合適的閾值以提取邊緣。而LOG算子是用5×5的模塊作為核與圖像中的每個(gè)像素點(diǎn)做卷積和運(yùn)算。
(2)一階微分運(yùn)算使用的數(shù)據(jù)少,對噪聲比較敏感。為提高算子本身的抗干擾能力,可以使用較大尺寸的模板。二階微分算子的抗干擾能力較差,使得圖像中的高頻噪聲增強(qiáng),邊緣檢測的效果不如梯度算子好。
(3)Roberts算子采用對角線方向相鄰兩像素之差近似梯度幅值檢測邊緣。檢測水平和垂直邊緣的效果好于斜向邊緣,定位精度高,對噪聲敏感。Sobel算子對噪聲具有平滑作用,提供較為精確的邊緣方向信息,但它同時(shí)也會檢測出許多的偽邊緣,邊緣定位精度不夠高。當(dāng)對精度要求不是很高時(shí),是一種較為常用的邊緣檢測方法。Prewitt算子和Sobel算子很相似,他們都是一階的微分算子,而前者是平均濾波,后者是加權(quán)平均濾波且檢測的圖像邊緣可能大于2個(gè)像素。這兩者對灰度漸變低噪聲的圖像有較好的檢測效果,但是對于混合多復(fù)雜噪聲的圖象,處理效果就不理想了。拉普拉斯算子抑制噪聲的能力和反干擾性能強(qiáng),但是應(yīng)用不如梯度算子廣泛。LOG算法是先對圖像作最佳平滑,然后再利用平滑圖像的二階微分零交叉確定邊緣位置。LOG 算法被認(rèn)為是微分法中利用平滑二階微分檢測圖像邊緣最成功的一種算子。
經(jīng)典邊緣檢測算子的Visual C++實(shí)現(xiàn)程序見附錄1,其圖像的邊緣檢測結(jié)果如圖2.5所示:
(1)原圖 (2)Roberts算子
(3)Sobel算子 (4)Prewitt算子
(5)拉普拉斯算子 (6)LOG算子
圖2.5 幾種邊緣檢測算子結(jié)果比較
從圖2.5可以看出,Roberts 算子提取邊緣的結(jié)果邊緣較粗,邊緣定位不很準(zhǔn)確,Sobel算子和Prewitt 算子對邊緣的定位就準(zhǔn)確了一些,而采用拉普拉斯高斯算子進(jìn)行邊緣提取的結(jié)果要明顯優(yōu)于前三種算子,特別是邊緣比較完整,位置比較準(zhǔn)確。而拉普拉斯算子不如梯度算子。
本節(jié)討論和比較了幾種常用的邊緣檢測算子。梯度算子計(jì)算簡單,但精度不高,只能檢測出圖像大致的輪廓,而對于比較細(xì)的邊緣可能會忽略。Prewitt和Sobel算子比Roberts效果要好一些。LOG濾波器的檢測效果優(yōu)于梯度算子,能夠檢測出圖像較細(xì)的邊緣部分。因此不同的系統(tǒng),需要針對不同的環(huán)境條件和要求,選擇合適的算子來對圖像進(jìn)行邊緣檢測。
第三章 小波變換的邊緣檢測方法及實(shí)現(xiàn)
3.1引言
自從1882年傅立葉發(fā)表”熱傳導(dǎo)解析理論”以來,傅立葉變換【14】一直是信號處理領(lǐng)域中最完美、應(yīng)用最廣泛、效果最好的一種分析手段。但是傅立葉變換只是一種純頻域的分析方法,它在頻域的定位性是完全準(zhǔn)確的(即頻域分辨率高),而在時(shí)域無任何定位性(或分辨能力),即傅立葉變換所反映的是整個(gè)信號全部時(shí)間下的整體頻域特征,而不能提供任何局部時(shí)間段上的頻率信息。相反,當(dāng)一個(gè)函數(shù)用δ函數(shù)展開時(shí),它在時(shí)間域的定位是完全準(zhǔn)確的,而在頻域卻無任何定位性(或分辨能力),也即δ函數(shù)分析所反應(yīng)的只是信號在全部頻率上的整體時(shí)域特征,而不能提供任何頻率段所對應(yīng)的時(shí)間信息。實(shí)際中,許多信號為時(shí)變信號,即它們的頻域特性都隨時(shí)間而變化,如音樂信號,在不同時(shí)間演奏不同音符;語音信一號,在不同時(shí)間對應(yīng)不同音節(jié)等。對于這類時(shí)變信號進(jìn)行分析,通常需要提取某一時(shí)間段(或瞬間)的頻域信息或某一頻率段所對應(yīng)的時(shí)間信息。因此,尋求一種介于傅立葉分析和δ分析之間的,并具有一定的時(shí)間和頻率分辨率的基函數(shù)來分析時(shí)變信號,一直是信號處理界及數(shù)學(xué)界人十長欺以來努力的目標(biāo)。
為了研究信號在局部時(shí)間范圍的頻域特征,1946年Gabor提出了著名的Gabor變換【15】,之后又進(jìn)一步發(fā)展為短時(shí)傅立葉變換。目前,短時(shí)傅立葉變換已在許多領(lǐng)域獲得了廣泛的應(yīng)用。但是由于短時(shí)傅立葉變換的定義決定了其窗函數(shù)的大小和形狀均與時(shí)間和頻率無關(guān)而保持固定不變,這對于分析時(shí)變信號來說是不利的。高頻信號一般持續(xù)時(shí)間很短,而低頻信號持續(xù)時(shí)間較長,因此,我們期望對于高頻信號采用小時(shí)間窗,對于低頻信號則采用大時(shí)間窗進(jìn)行分析。在進(jìn)行信號分析時(shí),這種變時(shí)間窗的要求同短時(shí)傅立葉變換下的固定時(shí)窗(窗不隨頻率而變化)的特性是相矛盾的。這表明短時(shí)傅立葉變換在處理這一類問題時(shí)己無能為力。此外,在進(jìn)行數(shù)值計(jì)算時(shí),人們希望將基函數(shù)離散化,以節(jié)約計(jì)算時(shí)間及存儲量。但Gabor基無論如何離散,都不能構(gòu)成一組正交基,因而給數(shù)值計(jì)算帶來了不便。這些是Gabor變換的不足之處,但卻恰恰是小波變換的特長所在。小波變換不僅繼承和發(fā)展了STFT的局部化的思想,而且克服了窗口大小不隨頻率變化,缺乏離散正交基的缺點(diǎn),是一種比較理想的進(jìn)行信號處理的數(shù)學(xué)工具。
在小波理論的發(fā)展過程中,發(fā)現(xiàn)它與工程技術(shù)上一些已經(jīng)發(fā)展起來的問題密切相關(guān)。它們都可以用小波變換作為理論基礎(chǔ),看成是從不同角度應(yīng)用小波所得的特例。如:Gabor提出的Gabor變換;Burt在1982年提出的金字塔式圖像壓縮編碼概念;通信及語言處理中的子帶編碼;數(shù)字信號處理中的多采樣率濾波器組;計(jì)算視覺中的多分辨率分析等。這些工程應(yīng)用領(lǐng)域大大豐富了小波變換的實(shí)用意義,也促進(jìn)了小波分析理論的進(jìn)一步發(fā)展。
目前小波分析在許多領(lǐng)域得到了廣泛應(yīng)用,如J.Morlet等將小波用于地震信號的分析與處理;S.Mallat將小波用于圖像的邊緣檢測、圖像壓縮與重構(gòu);M.Frisch等將小波變換用于噪聲中的未知瞬態(tài)信號;M.Frisch等將小波變換用于渦流的研究;M. V. Wickerhauser將小波包的理論用于圖像的壓縮;P.Dutilleux等將小波變換用于語音信號的分析、變換和綜合;Donoh將小波變換用于圖像的去噪等等。
3.2小波的來源
小波分析【16】來源于人們對時(shí)頻分析和多分辨率分析的研究。長期以來,人們力圖尋求一種函數(shù)系,它可以對任意函數(shù)進(jìn)行分解,并且擁有良好的時(shí)間局部性和頻率局部性。我們知道,F(xiàn)ourier 變換系,即三角函數(shù)系在頻域上是完全局部化的,但是在時(shí)間域上卻毫無局部性可言。而相反的,Haar 提出的 Haar 變換基在時(shí)間域上是完全局部化的。但在頻率域的局部性卻很差。
為了尋求關(guān)于時(shí)間變量和頻率變量都能夠適當(dāng)局部化的函數(shù)系,Gabor于1964年引入了窗口Fourier變換,就是在Fourier變換的基礎(chǔ)上,加上一個(gè)窗口函數(shù)g(x),這樣就把窗函數(shù)之外的信號濾除了,從而保證了時(shí)間域的局部性。窗口 Fourier 變換和反變換如下:
(3.1)
(3.2)
圖3.1 窗口Fourier變換的時(shí)頻分析
它的時(shí)頻窗在時(shí)頻坐標(biāo)系中如圖3.1所示??梢钥吹剑@是一個(gè)窗口大小及形狀都固定的時(shí)頻分析。但由于時(shí)間和頻率的反比關(guān)系,我們期望在高頻部分時(shí)間窗要窄一些,而在低頻部分則希望時(shí)間窗大一些,也就是在高頻時(shí)需要小的分辨率,低頻時(shí)需要大的分辨率。這就引入了多分辨率分析和尺度的概念。
小波分析的基本思想正是在不同的尺度和分辨率上處理數(shù)據(jù),如果用一個(gè)大的”窗口”觀察信號,我們將看到它的整體特征,如果用一個(gè)小的”窗口”來觀察它,則看到它的細(xì)節(jié)特征。通過改變尺度值,可以調(diào)整窗口的形狀,從而改變分辨率;通過平移窗口,可以觀察不同位置信號的細(xì)節(jié)。小波分析的這一特征,使其既可以獲得整體的信號特征,又可以獲得信號某一部分的細(xì)節(jié)特征:
我們知道,F(xiàn)ourier 變換使用的是正弦曲線作為它的正交基函數(shù)。之所以稱為波是因?yàn)樗鼈冾愃朴诖蠛5牟驮诿襟w中傳遞的波。對于積分變換來說這些函數(shù)都在兩個(gè)方向無限擴(kuò)展的。離散傅立葉變換的基向量也在它們的整個(gè)域中非零。與此同時(shí),圖像中的許多重要特征(如邊緣)也是在空間位置上高度局部化的,這些成分并不類似于任何一個(gè) Fourier 基函數(shù),它們的變換系數(shù)(即頻譜)也不是緊湊分布的。這就使得傅立葉變換在壓縮和分析包含瞬態(tài)或局部化成分的信號和圖像時(shí)得不到最佳表示。
為了克服這些缺陷,數(shù)學(xué)家和工程師們已經(jīng)開發(fā)出若干種使用有限寬度基函數(shù)進(jìn)行變換的方法。這些基函數(shù)不僅在頻率上而且在位置上是變化,它們是有限寬度的波并被稱為小波(Wavelet)?;谒鼈兊淖儞Q則被稱為小波變換(Wavelet Transform)。
圖3.2說明了 Fourier:變換基函數(shù)的”波”與小波變換基函數(shù)的”小波”之間的差別。上面的兩條曲線是頻率不同的余弦波,持續(xù)寬度不同。下面的兩條曲線是沿著軸向頻率和位置都不相同的小波。
圖3.2 波和小波
3.3小波變換簡介
3.3.1小波變換定義
小波(wavelet),即小區(qū)域的波,是一種特殊的長度有限、平均值為0的波形。小波函數(shù)的確切定義為:設(shè) 為一平方可積函數(shù),即 ,若其傅里葉變換滿足條件:
(3.3)
式中 為 的傅立葉變換。我們稱 為一個(gè)基本小波或小波母函數(shù),我們稱式(3-3)為小波函數(shù)的可容許條件。
3.3.2連續(xù)的小波變換
將小波母函數(shù) 進(jìn)行伸縮和平移,就可以得到函數(shù) :
(3.4)
則函數(shù) 的小波變換定義為:
(3.5)
其相應(yīng)的反變換公式為:
(3.6)
由 生成的函數(shù)族稱為分析小波或連續(xù)小波。在 中,a為尺度參數(shù),b為定位參數(shù), 隨參數(shù)a、b而變化。若 a > 1函數(shù) 具有伸展作用,a < 1函數(shù) 具有收縮作用。隨著參數(shù)a的減小, 的支撐區(qū)也隨之變窄,而 的頻譜隨之向高頻端展寬,反之亦然。這有可能實(shí)現(xiàn)窗口大小自適應(yīng)變化,當(dāng)信號頻率增高時(shí),時(shí)窗寬度變窄,而頻窗寬度增大,有利于提高時(shí)頻分辨率,反之亦然。
3.3.3離散小波變換
離散小波變換是對基本小波 的尺度和平移進(jìn)行離散化。在實(shí)際的圖像處理中,常采用二進(jìn)制小波作為小波作為小波變換函數(shù),即使用2的整數(shù)次冪進(jìn)行劃分。取 (j,k為整數(shù)),則得到離散化的小波函數(shù)族 。
離散小波變換的定義為:
(3.7)
其重建公式表示為:
(3.8)
其中, 稱為 的對偶,它可以由基本小波 通過伸縮和平移得到。
3.3.4二維小波變換
二維小波變換和一維小波變換的定義實(shí)質(zhì)上是一樣的,只是將一維的基本小波擴(kuò)展到二維的基本小波。其定義可以表示為:
(3.9)
其中 和 表示兩個(gè)維度上的平移。
二維小波變換的逆變換相應(yīng)的變?yōu)椋?BR>(3.10)
其中 。
3.4小波變換邊緣檢測的設(shè)計(jì)和實(shí)現(xiàn)
3.4.1小波變換邊緣檢測的優(yōu)點(diǎn)
在實(shí)際的邊緣檢測應(yīng)用中,許多經(jīng)典的檢測算子都對帶有噪聲的圖像無能為力,因?yàn)樵肼暠旧硪簿哂型蛔兊奶攸c(diǎn),于是噪聲這樣的突變點(diǎn)和圖像邊界的突變點(diǎn)混在一起,采用經(jīng)典的方能夠法無法將它們區(qū)分開來。
小波變換能較好地解決了時(shí)間和頻率分辨率的矛盾。它巧妙地利用了非均勻分布的分辨率,在低頻段用高頻分辨率和低的時(shí)間分辨率;而在高的頻率段則利用低的頻率分辨率和高的時(shí)間分辨率。即具有”變焦”功能,被稱為”數(shù)學(xué)顯微鏡”。因此小波變換是檢測突變信號強(qiáng)有力的工具,能很好地刻劃突變點(diǎn)的奇異性,使用小波利用奇異性檢測的方法可以區(qū)分圖像邊緣,消除噪聲,與傳統(tǒng)方法相比較,小波變換檢測具有很大的優(yōu)越性,更可以通過多分辨率分析來分析信號,獲得滿意的效果。
小波變換可以將圖像信號分解成呈現(xiàn)在不同尺度上的多個(gè)分量,尺度S 描繪出通過小波變換所提取的圖像信號特征。在不同尺度下,離散信號的全面描述取決于在尺度時(shí),對整數(shù) j 研究下的小波變換的局部極大值。通過增加兩個(gè)局部極大值點(diǎn)間”尺寸”,可以增加信號的信息分量。小波變換的局部極大值點(diǎn)刻畫出了圖像信號突變點(diǎn)的位置(圖像邊緣位置)。
3.4.2小波變換模局部極大值邊緣檢測的原理和步驟
多分辨率思想在計(jì)算機(jī)視覺和圖像處理的許多領(lǐng)域都得到了廣泛的應(yīng)用,圖像的多分辨率分解使得圖像隨著分辨率的降低,尺寸迅速減小,同時(shí)低分辨率可以降低圖像處理的復(fù)雜度,從而大大減少圖像處理對先驗(yàn)知識的依賴程度。基于小波多分辨率分析的圖像分解算法的基本思想是:在選定合適的正交小波基的基礎(chǔ)上,對圖像進(jìn)行二維小波分解。
對于二維圖像,設(shè)一平滑函數(shù) ,它具有良好的局部化特性,并且滿足:
(3.11)
對平滑函數(shù) 分別求 x方向和 y 方向的偏導(dǎo)數(shù),則有:
(3.12)
則 和 可以看作二維小波函數(shù)。對于任意函數(shù) ,由
兩個(gè)小波 和 定義的小波變換具有兩個(gè)分量:
(3.13)
(3.14)
梯度矢量為:
(3.15)
其中s為尺度系數(shù), 和 分別表征圖像中沿x,y方向的偏導(dǎo)。小波變換在尺度 的模和幅角分別為:
(3.16)
(3.17)
因?yàn)樾〔ㄗ儞Q的模 正比于梯度向量 的模,而小波變換的幅角 ,是梯度向量 與水平方向的夾角,它正是圖像邊緣的方向。所以,如果檢測邊緣,只需尋找梯度向量 的模的局部最大值點(diǎn)。在每一個(gè)尺度 ,小波變換的模的最大值都定義為模 在沿著梯度方向 的局部最大值點(diǎn)。
根據(jù)前面的分析可以知道,用小波系數(shù)的局部最大值點(diǎn)可刻畫出圖像信號突變點(diǎn)的位置,即圖像邊緣的位置,小波變換的最大值檢測對應(yīng)圖像的邊緣檢測。用小波檢測圖像邊緣的步驟也就可以歸結(jié)如下【17】:
步驟一:選定平滑函數(shù) 為尺度函數(shù),用(3.12)式求出函數(shù) 的一階導(dǎo)數(shù) 和 ,將 和 為小波函數(shù),構(gòu)成多尺度小波變換。
步驟二:用(3.13)式和(3.14)式對圖像進(jìn)行小波變換,求得小波變換的兩個(gè)分量 和 ,再由求得的小波系數(shù)根據(jù)(3.16)式和(3.17)式計(jì)算不同尺度 下的幅角 和模 。
步驟三:分別從圖像每一行小波系數(shù)中,找出零交叉點(diǎn)。
步驟四:在兩個(gè)相鄰零交叉點(diǎn)之間檢測出小波系數(shù)的極大值點(diǎn),包括正或負(fù)的極大值。
步驟五:由于噪聲的存在,必須設(shè)定一個(gè)閾值濾去噪聲,過濾掉噪聲和細(xì)微細(xì)節(jié)生成的極值。
步驟六:對給定的圖像每一列重復(fù)步驟三、四、五。
步驟七:在行和列同時(shí)得到極大值點(diǎn)的地方認(rèn)為有邊緣,否則就認(rèn)為無邊緣。
根據(jù)上述步驟,小波變換圖像邊緣檢測的流程圖如圖3.3所示:
圖3.3 小波變換邊緣檢測流程圖
3.4.3小波邊緣檢測的實(shí)驗(yàn)結(jié)果比較
根據(jù)小波變換邊緣檢測的流程圖,我們利用Matlab進(jìn)行編程,對大米的圖像進(jìn)行邊緣檢測,具體程序見附錄2,其結(jié)果如圖3.4所示:
(1)原圖(大米) (2)J=4
(3)J=6 (4)J=8
圖3.4 不同尺度的小波變換邊緣檢測的結(jié)果
圖3.4中小波變換尺度分別取J=4,J=6,J=8,圖像在 J = 4,J = 6和J=8下的檢測效果比較,圖像在 J = 8下檢測的圖像的邊緣更為完整,也就是說,J = 8時(shí)小波分解的細(xì)節(jié)部分保留了更多的圖像邊緣細(xì)節(jié),因而重構(gòu)之后的圖像經(jīng)過濾波和二值化后得到的邊緣更完整。
第四章 邊緣檢測在人臉識別中的應(yīng)用
4.1生物識別技術(shù)
生物特征識別技術(shù)【18】是利用人體特有的生理或行為特征來進(jìn)行身份識別。人的生理特征是與生俱來的,而行為特征通常則是后天習(xí)慣養(yǎng)成的。從理論上說,任何人體的生理或行為特征,只要滿足一定要求,如普遍性、唯一性、穩(wěn)定性、取樣方便性、用戶可接受性、樣本防偽性、計(jì)算復(fù)雜性等條件,都可以用來作為識別個(gè)人身份的特征。
生物特征識別技術(shù)可分為基于生理特征的生物識別技術(shù)和基于行為特征的生物識別技術(shù)。目前,研究比較深入,應(yīng)用比較廣泛的生物識別技術(shù)有:指紋、人臉、人臉溫譜、虹膜、視網(wǎng)膜、手型、聲紋以及簽名等。指紋、人臉、人臉溫譜、虹膜、視網(wǎng)膜和手型為生理特征,聲紋和簽名為行為特征。
4.2人臉識別技術(shù)研究的背景及意義
從第四屆IEEE人臉與姿勢識別國際會議收錄的文獻(xiàn)[19]來看,人臉識別研究包括人臉檢測、人臉跟蹤、人臉識別和表情分析四個(gè)主要領(lǐng)域。人臉檢測是指從靜止圖像或視頻流中發(fā)現(xiàn)人臉并確定圖像中人臉的數(shù)量和位置并將人臉圖像從背景圖像中分離出來。根據(jù)應(yīng)用的場合不同,人臉檢測可分為可控背景下的人臉檢測和任意背景下的人臉檢測,如計(jì)算機(jī)前的人臉檢測是可控背景下的人臉檢測;機(jī)場、海關(guān)等入口處的人臉檢測是任意背景下的人臉檢測。人臉跟蹤用于需要連續(xù)探測和識別人臉的場所,如計(jì)算機(jī)前、可視電話會議等。人臉識別是將檢測到的人臉圖像的特征信息,與已知的人臉的特征信息進(jìn)行比較,從而判斷一個(gè)人臉是否為一個(gè)己知的人臉。表情分析用于判斷一個(gè)人的喜怒哀樂、性格及心理分析。在這四個(gè)研究領(lǐng)域中最重要的是人臉檢測,只有檢測到人臉并將人臉圖像從背景圖像中分離出來后,其他的工作才容易進(jìn)行。使用的場所不同,采用的技術(shù)手段也不同,故一個(gè)人臉探測產(chǎn)品往往只具有某幾個(gè)功能并適合某些場所的需要;不同技術(shù)開發(fā)出的產(chǎn)品往往具有各自的優(yōu)缺點(diǎn)和適應(yīng)場所。人臉檢測、人臉跟蹤、人臉識別和表情分析的典型組合應(yīng)用【20】如下:
人臉檢測:用于人臉圖像的提取和記錄,如用于代替現(xiàn)有的入門登記。
人臉檢測+人臉跟蹤:用于可視電話會議和可視電話。
人臉檢測+人臉跟蹤+人臉識別:用于互聯(lián)網(wǎng)登錄及重要設(shè)備操作管制等。
人臉檢測+人臉識別:用于驗(yàn)證,如身份證、自動取款機(jī)、護(hù)照等;用于安全監(jiān)控,追捕和跟蹤逃犯等。
人臉檢測+表情識別:緊張心理分析;用于海關(guān)反走私;不誠實(shí)心理分析;用于商業(yè)談判和外交談判。
隨著社會的發(fā)展,各個(gè)方面對快速有效的自動身份驗(yàn)證的需求日益迫切。由于生物特征是人的內(nèi)在屬性,具有很強(qiáng)的自身穩(wěn)定性和個(gè)體差異性,因此是身份驗(yàn)證最理想的依據(jù)。這其中,利用人臉進(jìn)行身份驗(yàn)證又是最自然最直接的手段,相比其它人體生物特征,它具有直接、友好、方便的特點(diǎn),易為用戶所接受。
4.3 人臉檢測的程序?qū)崿F(xiàn)界面
在實(shí)現(xiàn)經(jīng)典的邊緣檢測算法時(shí),使用的是Visual C++這個(gè)軟件。首先新建一個(gè)工程,工程名叫DSplit,選擇MFC AppWizard(exe),然后在選擇新建一個(gè)文件C++ Source File,叫BianYuanJianCeDib,主要程序就在這個(gè)文件中(見附錄1)。
打開邊緣檢測文件夾中的Release文件夾,雙擊 文件,出現(xiàn)以下界面,如圖4.1所示:
圖4.1 經(jīng)典邊緣檢測程序界面
比起其他的經(jīng)典邊緣檢測的Visual C++實(shí)現(xiàn),我的程序有一點(diǎn)創(chuàng)新,那就是一般程序要求原始圖像為8位灰度圖像,而我的程序可以選擇打開8位或24位灰度圖像。如圖4.2所示:
圖4.2 打開8位或24位圖像文件
點(diǎn)文件選擇打開8位或24位灰度圖像,然后在路徑中選擇一幅圖像girl.bmp,點(diǎn)左邊的空白框再點(diǎn)擊顯示原圖按鍵,然后點(diǎn)右邊的空白框部分再點(diǎn)擊邊緣檢測進(jìn)行所需要的圖像邊緣檢測,如圖4.3:
圖4.3 DSplit使用演示
在實(shí)現(xiàn)小波變換的邊緣檢測時(shí),我們選用Matlab,由于Matlab集中了日常數(shù)學(xué)處理的多種功能,所以實(shí)現(xiàn)比較簡單,易懂。
首先單擊File,下拉菜單選擇Open,打開在默認(rèn)路徑D:\matlab\work中的edgedetect_basedonWavelet.m文件,按F5運(yùn)行程序,圖4.4就是J=8時(shí)小波變換的程序?qū)崿F(xiàn)界面:
圖4.4 J=8時(shí)小波變換的程序?qū)崿F(xiàn)界面
4.4 不同算法實(shí)現(xiàn)人臉檢測及其結(jié)果分析
人臉邊緣是人臉非常重要的一個(gè)特征。對人臉邊緣的檢測,可以應(yīng)用于人臉輪廓的提取,人臉區(qū)域的分割。應(yīng)用邊緣信息對人臉進(jìn)行檢測是一種有效的方法。但由于光照條件,場景的變化以及圖像噪聲給邊緣檢測的效果造成不良的影響,因此新的更有效的邊緣檢測方法如何有效地將邊緣信息應(yīng)用于人臉檢測和識別將作進(jìn)一步的研究。
人臉圖像邊緣檢測作為人臉識別技術(shù)的第一步,在人臉識別系統(tǒng)中起很大的作用。如何確定人臉特征并對這些特征進(jìn)行有效的提取是非常關(guān)鍵而目復(fù)雜的。人臉邊緣和輪廓是人臉非常重要的特征。我們前面研究了邊緣檢測的原理和各種算法,現(xiàn)在我們打算通過試驗(yàn)驗(yàn)證各種檢測方法在人臉圖像中對邊緣的檢測效果,討論選用在不同算法下檢測的邊緣,以及影響檢測效果的因素。
圖4.5是對lena人臉的經(jīng)典邊緣檢測和小波變換邊緣檢測的結(jié)果:
(1)Lena (2)Roberts算子
(3)Sobel算子 (4)拉普拉斯算子
(5)LOG算子 (6)小波變換(J=8)
圖4.5 幾種人臉邊緣檢測算法比較
Lena圖片(256*256*8bit)圖像是一幅邊緣比較復(fù)雜的自然圖像,常規(guī)邊緣算子很難同時(shí)檢測出所有類型的邊緣。最后一副圖像用小波進(jìn)行邊緣檢側(cè),利用小波的多尺度特性,在小尺度上,提取如瞳孔等邊緣的細(xì)節(jié),在大尺度上提取平滑的較長的邊緣鏈如立柱等。
圖4.6是含噪聲圖像的人臉邊緣檢測結(jié)果比較:
(1)含噪聲的lena圖像 (2)Roberts算子
(3)Sobel算子 (4)拉普拉斯算子
(5)LOG算子 (6)小波變換(J=8)
圖4.6含噪聲lena圖像的邊緣檢測結(jié)果
在圖4.6中,圖(1)是lena圖像疊加噪聲后的含噪圖像。后面幾幅分別是對圖像進(jìn)行不同邊緣檢測的圖片,Roberts算子對噪聲敏感,所以檢測出許多偽邊緣。而拉普拉斯算子幾乎看不出圖像的邊緣。LOG算法是先對圖象作最佳平滑,所以檢測效果要好于前面幾種算子。最后一幅圖采用小波變換多尺度法提取圖像的邊緣,通過細(xì)節(jié)和粗節(jié)進(jìn)行逼近,使得大尺度下抑制噪聲,小尺度下邊緣精確定位,從圖4.6中我們看出只有用小波變換的圖片可清晰辨別出圖像中的輪廓特征,證實(shí)小波算法邊緣性很好,抑制噪聲能力很強(qiáng),并且邊緣提取比較細(xì)致,效果顯然優(yōu)于其他算子檢測的圖像邊緣。
人臉邊緣是人臉圖像的一個(gè)重要特征,應(yīng)用邊緣信息對人臉進(jìn)行檢測是一種有效的方法。但由于光照條件,場景的變化以及圖像噪聲給邊緣檢測的效果造成不良的影響,因此新的更有效的邊緣檢測方法如何有效地將邊緣信息應(yīng)用于人臉檢測和識別將作進(jìn)一步的研究。使其應(yīng)用于以下的一些實(shí)際場所:
1.訪問控制
在安全性要求較高的政府、醫(yī)院或某些公共場所,可以建立無門衛(wèi)的門禁系統(tǒng),對來訪者通過人臉識別系統(tǒng)進(jìn)行驗(yàn)證。在登錄網(wǎng)絡(luò)或計(jì)算機(jī)時(shí),可以用人臉識別技術(shù)(Face Recognition Technology,F(xiàn)RT)代替口令的輸入,這樣就不用擔(dān)心口令的丟失、忘記或被竊取,從而增加重要文件的安全性。訪問控制通常是一對一的驗(yàn)證,圖像質(zhì)量可控。
2.司法應(yīng)用
最常見的是嫌犯(mug shot)識別,基本方法是對比目標(biāo)特征和數(shù)據(jù)庫存儲特征的相似性。目標(biāo)圖像的自然屬性是關(guān)鍵的,且決定著整個(gè)過程的困難程度。比如,有時(shí)候目標(biāo)圖像僅是通過目擊證人的口頭描述而勾勒出來的,這顯然不能和實(shí)拍照片相比。其它類似的應(yīng)用有駕照、護(hù)照等的識別。人臉識別可以大大提高司法部門的效率。司法應(yīng)用通常是一對多的識別,圖像質(zhì)量一般情況下較好。
3.電子商務(wù)
在在線金融、貿(mào)易活動中,人臉識別可以提供客戶的身份認(rèn)證,并保證商業(yè)活動無拒付地良性運(yùn)轉(zhuǎn)。這對于交易雙方、銀行都是很方便的,因?yàn)椤盢o PIN to remember,no PIN to forget”。電子商務(wù)通常是一對一驗(yàn)證,圖像質(zhì)量較好。
4.視頻監(jiān)控
監(jiān)控一般在當(dāng)事人不知道的情況下進(jìn)行。利用人臉識別技術(shù),監(jiān)控者可以從大街上或進(jìn)入大樓、機(jī)場的人群中找到自己要找的人。監(jiān)控通常是一對多,或多對多的識別。圖像質(zhì)量是不可控的,并且一副圖像中存在多個(gè)人臉,具有姿態(tài)、視角、尺度、光照、遮擋等寬范圍的變化。對比人臉識別,其它的生物特征識別技術(shù)很難在監(jiān)控領(lǐng)域得到應(yīng)用。
由于人臉邊緣檢測技術(shù)是人臉識別的基礎(chǔ),而在不同的外部因素影響下圖像邊緣將受到很大的影響。我們必須站在前人的肩膀上繼續(xù)努力,不斷改進(jìn)算法,并且發(fā)現(xiàn)新的方法,為人臉識別技術(shù)的發(fā)展提供有力的底層基礎(chǔ)。
第五章 結(jié)論與展望
圖像邊緣是圖像最基本的特征之一,攜帶了一幅圖像的大部分信息。而邊緣存在于信號的奇異點(diǎn)或突變點(diǎn)處,也存在于圖像的不規(guī)則結(jié)構(gòu)和不平穩(wěn)現(xiàn)象中,這些點(diǎn)給出了圖像輪廓的位置,這些輪廓則常常是我們在圖像處理時(shí)所需要的非常重要的一些特征條件,這就需要我們對一幅圖像檢測和提取出它的邊緣圖像.而邊緣檢測算法則是圖像處理問題中的經(jīng)典技術(shù)難題之一,它的解決對于我們進(jìn)行高層次的特征描述、識別和理解等有著重大的影響。本文的主要工作如下:
(1)介紹了經(jīng)典的圖像邊緣檢測方法。包括:差分邊緣檢測、Roberts算子、Sobel算子 、Prewitt算子和拉普拉斯算子,并通過理論分析和Visual C++實(shí)現(xiàn)算法,比較了它們各自的優(yōu)缺點(diǎn)。這類經(jīng)典的方法大都基于微分技術(shù)來確定圖像的邊緣,算法簡單,但抗噪性能較差,適用于邊緣比較清晰的圖像邊緣檢測。
(2)討論了基于線性濾波技術(shù)的邊緣檢測方法:LOG方法,這種方法是通過設(shè)計(jì)最優(yōu)濾波器,再與圖像進(jìn)行卷積,提取出邊緣的極大值點(diǎn),從而確定出圖像的邊緣。仿真結(jié)果表明,其效果強(qiáng)于經(jīng)典的邊緣檢測方法,適用于背景較復(fù)雜圖像的邊緣檢測。
(3)研究了利用小波變換進(jìn)行圖像邊緣檢測的方法,并用Matlab實(shí)現(xiàn)。小波變換具有良好的時(shí)頻局部化特性及多尺度分析能力,本文利用選取合適的小波基函數(shù),通過對含有噪聲Lena圖像進(jìn)行邊緣檢測,及其與前面方法的對比顯示出了這類方法的良好效果 。
(4)闡述了人臉識別技術(shù)在各個(gè)領(lǐng)域的應(yīng)用,并通過前面所提及到的算子檢測人臉識別的基礎(chǔ)人臉邊緣。
本文僅是對圖像邊緣檢測中常用方法的一個(gè)初步總結(jié)與探討,由于時(shí)間及本人對圖像處理所涉及的知識的了解也較有限,本文的一些分析與結(jié)果尚顯粗淺和不全面。筆者認(rèn)為,進(jìn)一步的工作應(yīng)該考慮到如下幾個(gè)方面:
(1)如何提高邊緣檢測算子的抗噪性能,以便可以精確地檢測出帶噪圖像的邊緣 ,從而提高算法的實(shí)用性。
(2)在邊緣檢測中,對于大量的圖像,如何構(gòu)造邊緣檢測的閥值,使得盡可能檢測出圖像的真實(shí)邊緣,又使檢測出的偽邊緣盡可能的少。
(3)如何處理和防止利用小波變換方法進(jìn)行圖像邊緣檢測時(shí)所造成的邊緣漂(移位)問題。
(4)在灰度圖像邊緣研究的基礎(chǔ)上,結(jié)合彩色圖像的特點(diǎn),開展彩色圖像邊緣檢測的研究。
參考文獻(xiàn)
[1] 徐建華.圖像處理與分析[M].北京:科學(xué)出版社,1992.79~84.
[2] Castleman K R. 數(shù)字圖象處理[M]. 朱志剛,林學(xué)閆,石定機(jī)譯. 北京:電子工業(yè)出版社,1998.56~76.
[3] R. J. Beanie.Edge detection for semantically based early visual processing[D], Edinburgh: Univ. Edinburgh, 1984,62~65.
[4] V. Torre, T. Poggio. On edge detection[J]. IEEE Trans. Pattern Analysis and Machine Intelligence, 1986, 8(2):147~163.
[5] 王慧燕. 圖像邊緣檢測和圖像匹配研究及應(yīng)用 [D] :[博士學(xué)位論文]. 杭州 : 浙江大學(xué),2003.
[6] G. Robinson. Edge detection by compass gradient masks[J]. Computer Graphics and Image Processing, 1977, 6(5):492~501.
[7] D. Marr, E. Hildreth. Theory of edge detection. Proceedings of the Royal Society of London[C]. London, England, 1980. 187~217.
[8] B.byBuxton.human Early visual image processing structural techniques motivated response[D]. Guildford, England: University of Surrey, 1984.
[9] L O Chua,L Yang.Cellular neutal networks:Thory[J].IEEE Trans Circuits Syst, 1988, 35(10): 1257~1272.
[10] E H Marmdani,Advances in linguistic synthesis of fuzzy controller[J]. Man-machine studies, 1976, 8(6): 669~679.
[11] 阮秋琦.數(shù)字圖像處理學(xué)[M]. 北京: 電子工業(yè)出版社, 2001.
[12] T. Peli, D. Malah. A study of edge detection algorithms[J]. Computer Graphics and Image Processing,1982,20(1):1~21.
[13] B.byBuxton.human Early visual image processing structural techniques motivated response[D]. Guildford, England: University of Surrey, 1984.
[14] Nurgun Erdol,F(xiàn)iliz Basbug. Performance of Wavelet Transform Based Adaptive Filters[C]. ICASSO 1993. 500~503.
[15] Y S Fong, C A Pomalaza Rxes, X H Wang. Comparison Study of Nonlinear Filter in Image Processing Application[J]. Opt Enginering, 1989, 28(7): 749~760.
[16] 秦前清,楊宗凱. 實(shí)用小波分析[M]. 西安: 西安電子科技大學(xué)出版社. 1995. 50~65.
[17] 王幼松,蔣韶輝,裴承鳴. 基于提升小波的顫振圖像邊緣檢測方法研究[J]. 機(jī)械設(shè)計(jì)與制造, 2005, 6(2): 15~17.
[18] 鄧煒,王軍安,楊永生. 計(jì)算機(jī)圖象識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用研究, 2000, 31(6): 79~80.
[19] 王良民,張建明等, 人臉檢測研究現(xiàn)狀和發(fā)展[N], 江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版), 2003年第5期: 75~79.
[20] 李剛,高政, 人臉檢測技術(shù)研究與發(fā)展[N], 計(jì)算機(jī)與現(xiàn)代化, 2004年第4期.