《測(cè)繪學(xué)報(bào)》 均方誤差意義下的正則化參數(shù)二次優(yōu)化方法 林東方1, 朱建軍2, 付海強(qiáng)2,張兵2 1.湖南科技大學(xué)地理空間信息技術(shù)國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室, 湖南 湘潭 411201; 收稿日期:2019-04-23;修回日期:2019-10-23 基金項(xiàng)目:湖南省教育廳科研項(xiàng)目(18C0312);湖南省科技廳重大專項(xiàng)(2018GK205);國(guó)家自然科學(xué)基金(41531068;41574006;41674012);湖南科技大學(xué)科研項(xiàng)目(CXTD004) 第一作者簡(jiǎn)介:林東方(1986-), 男, 博士, 講師, 研究方向?yàn)閿?shù)據(jù)處理理論與方法及PolInSAR應(yīng)用。E-mail:lindongfang223@163.com 通信作者:朱建軍, E-mail:zjj@csu.edu.cn 摘要:Tikhonov正則化法是大地測(cè)量中應(yīng)用最為廣泛的病態(tài)問(wèn)題解算方法之一。影響正則化法解算效果的重要因素是正則化參數(shù),然而,最優(yōu)正則化參數(shù)的確定一直是正則化解算的難題,如L曲線法確定的正則化參數(shù)具有穩(wěn)定性好、可靠性高的優(yōu)點(diǎn),但存在過(guò)度平滑問(wèn)題,導(dǎo)致正則化法對(duì)模型參數(shù)估值精度改善較小。本文從均方誤差角度分析了正則化參數(shù)對(duì)模型參數(shù)估計(jì)質(zhì)量的影響?;谄娈愔捣纸饧夹g(shù),提出了由模型參數(shù)投影值分塊計(jì)算均方誤差的方法,避免了均方誤差迭代計(jì)算,并基于均方誤差最小準(zhǔn)則給出了正則化參數(shù)優(yōu)化方法,實(shí)現(xiàn)了對(duì)L曲線正則化參數(shù)的優(yōu)化。數(shù)值模擬試驗(yàn)與PolInSAR植被高反演試驗(yàn)結(jié)果表明,正則化參數(shù)優(yōu)化方法有效改善了正則化法解算效果,提高了模型參數(shù)估計(jì)精度。 關(guān)鍵詞:病態(tài)問(wèn)題 正則化方法 正則化參數(shù) 均方誤差 L曲線 Optimization of regularization parameter based on minimum MSE LIN Dongfang1, ZHU Jianjun2, FU Haiqiang2, ZHANG Bing2 1.National-Local Joint Engineering Laboratory of Geo-Spatial Information Technology, Hunan University of Science and Technology, Xiangtan 411201, China; Foundation support: The Research Project of Education Department of Hunan Province (No. 18C0312); The Provincial Key Research and Development Program of Hunan (No. 2018GK2015); The National Natural Science Foundation of China (Nos. 41531068; 41574006; 41674012); The Research Program of Hunan University of Science and Technology (No. CXTD004) First author: LIN Dongfang(1986—), male, PhD, lecturer, majors in surveying adjustment and PolInSAR application E-mail:lindongfang223@163.com. Corresponding author: ZHU Jianjun, E-mail: zjj@csu.edu.cn. Abstract: Tikhonov regularization method is widely used in geodesy for ill-posed problems. The regularization parameter is an important factor for regularization method to solve the ill-posed problem. However, it is very difficult to determine an optimal regularization parameter. L-curve method is proposed to determine the feasible regularization parameter, which is well known to be a stable and reliable method. However, the extensive application researches show that the regularization parameter determined by L-curve method often leads to oversmoothed results. As a result, the regularization method cannot effectively improve the estimation accuracy of model parameters. Concerning this issue, this paper analyzes the effectiveness of regularization parameter on MSE (mean square error) of regularized estimation. Then, an MSE calculation method is proposed by using SVD (singular value decomposition) technology. In the method, the MSE is divided into several parts that correspond to the singular values. Therefore, the iterative calculation of MSE is avoided and the reasonable regularization parameter can be determined part to part. Using the reliable parts of MSE, the most useful regularization parameter can be determined to optimize the L-curve determined regularization parameter. Finally, the regularization parameter optimization method is proposed. Numerical example and PolInSAR vegetation inversion experiment are carried out to demonstrate the effectiveness of the regularization parameter optimization method. The results show that the regularization parameter optimization method can greatly improves the model parameter estimation of regularization method. Key words: ill-posed problem regularization method regularization parameter mean square error L-curve 病態(tài)問(wèn)題導(dǎo)致模型參數(shù)估計(jì)對(duì)觀測(cè)數(shù)據(jù)誤差極度敏感,觀測(cè)數(shù)據(jù)中的微小誤差即會(huì)引起模型參數(shù)估值的巨大誤差,嚴(yán)重影響模型參數(shù)的估計(jì)精度。大地測(cè)量中的地球重力場(chǎng)測(cè)量,GPS空間測(cè)量、InSAR地表測(cè)量等應(yīng)用領(lǐng)域常會(huì)出現(xiàn)病態(tài)問(wèn)題,合理可靠地處理病態(tài)問(wèn)題成為大地測(cè)量數(shù)據(jù)處理的重要研究?jī)?nèi)容[1-3]。 解決病態(tài)問(wèn)題的關(guān)鍵在于消除或減弱病態(tài)函數(shù)模型對(duì)模型參數(shù)估計(jì)的影響。文獻(xiàn)[4]提出的解算病態(tài)問(wèn)題的正則化方法,是目前應(yīng)用最為廣泛的方法之一。影響正則化方法解算效果的關(guān)鍵是穩(wěn)定泛函與正則化參數(shù)的選擇。穩(wěn)定泛函的選擇多依據(jù)模型參數(shù)的先驗(yàn)信息[5-7],以此構(gòu)建的穩(wěn)定泛函可有效補(bǔ)充觀測(cè)信息,改善模型結(jié)構(gòu),具有較好的可行性和有效性[8-9]。而先驗(yàn)信息無(wú)法獲得時(shí),穩(wěn)定泛函常表示為模型參數(shù)的二范約束[10-11],該方式無(wú)須先驗(yàn)信息,具有較好的普適性,但對(duì)正則化參數(shù)的依賴性較高。針對(duì)正則化參數(shù)確定問(wèn)題,國(guó)內(nèi)外學(xué)者從不同角度提出了多種正則化參數(shù)確定方法。文獻(xiàn)[12]從統(tǒng)計(jì)學(xué)的角度提出了確定正則化參數(shù)的GCV(generalized cross-validation)法,該方法通過(guò)交叉驗(yàn)證的方式確定正則化參數(shù)使觀測(cè)值殘差平方和最小。文獻(xiàn)[13—14]在計(jì)算方式與計(jì)算效率上對(duì)GCV法進(jìn)行了改進(jìn)。然而由于病態(tài)性的影響,以觀測(cè)值殘差平方和最小作為正則化參數(shù)確定準(zhǔn)則,難以保證模型參數(shù)的估計(jì)質(zhì)量。文獻(xiàn)[15]通過(guò)分析正則化估計(jì)的擬合度與平滑度關(guān)系,提出了確定正則化參數(shù)的L曲線法。L曲線法確定的正則化參數(shù)具有較好的穩(wěn)定性,但確定的正則化參數(shù)常存在過(guò)度平滑的問(wèn)題[16]。文獻(xiàn)[17—18]從改善模型參數(shù)估計(jì)質(zhì)量的角度,提出了基于均方誤差最小準(zhǔn)則的正則化參數(shù)確定方法。文獻(xiàn)[19—20]分析了正則化方法相較于無(wú)偏估計(jì)方法在病態(tài)問(wèn)題解算中的優(yōu)勢(shì),驗(yàn)證了正則化方法在均方誤差上優(yōu)于無(wú)偏估計(jì)方法。文獻(xiàn)[21]從降低參數(shù)估值均方誤差的角度提出了偏差改正的正則化方法,進(jìn)一步改善了模型參數(shù)的正則化估計(jì)。正則化法為有偏估計(jì)方法,其估值均方誤差包含方差與偏差兩個(gè)部分,明確反映了模型參數(shù)的估計(jì)質(zhì)量,基于均方誤差最小準(zhǔn)則改善正則化估計(jì),理論更為嚴(yán)密,有利于平衡模型參數(shù)估計(jì)穩(wěn)定性與可靠性。但均方誤差的計(jì)算需要模型參數(shù)真值,以估值代替真值迭代計(jì)算均方誤差[22],容易陷入局部最優(yōu)或不收斂,限制了均方誤差意義下正則化方法的改進(jìn)效果。 正則化參數(shù)的選擇對(duì)于正則化方法至關(guān)重要,常用的正則化參數(shù)確定方法,從不同的分析角度提出,各具優(yōu)勢(shì),但均難以給出最優(yōu)的正則化參數(shù)[23-24]。均方誤差意義下正則化參數(shù)的確定體現(xiàn)了估計(jì)精度與偏差的折中,理論依據(jù)更為直觀高效。本文研究利用奇異值分解技術(shù)分析均方誤差計(jì)算過(guò)程,提出均方誤差按奇異值大小分塊計(jì)算方法,避免均方誤差迭代計(jì)算與錯(cuò)誤計(jì)算,基于均方誤差最小準(zhǔn)則實(shí)現(xiàn)正則化參數(shù)的優(yōu)化,從而改善正則化參數(shù)有效性與可靠性,提高模型參數(shù)估計(jì)精度。 1 正則化參數(shù)優(yōu)化方法1.1 正則化方法 病態(tài)問(wèn)題嚴(yán)重影響了模型參數(shù)的估計(jì)質(zhì)量,常規(guī)估計(jì)手段已難以獲得參數(shù)的有效估值。為了減弱病態(tài)性影響,Tikhonov提出了解算病態(tài)問(wèn)題的正則化方法,該方法在常規(guī)最小二乘估計(jì)基礎(chǔ)上引入穩(wěn)定泛函與正則化參數(shù),以改善模型參數(shù)估計(jì)穩(wěn)定性[4] (1) 式中,V=AX-L,表示觀測(cè)值殘差向量;L為觀測(cè)值向量;X表示未知模型參數(shù);P為權(quán)重矩陣;α表示正則化參數(shù);R表示正則化矩陣;XTRX為穩(wěn)定泛函,表示未知參數(shù)間存在的函數(shù)關(guān)系。在模型參數(shù)存在已知的先驗(yàn)信息時(shí),先驗(yàn)信息可通過(guò)穩(wěn)定泛函引入模型參數(shù)估計(jì)中。而在無(wú)法獲得先驗(yàn)信息時(shí),穩(wěn)定泛函常表示為XTX,正則化矩陣為單位矩陣,此時(shí),正則化法的模型參數(shù)估值為 (2) 式中,表示正則化模型參數(shù)估值;I表示單位矩陣。由于不同先驗(yàn)信息構(gòu)造出的正則化矩陣有所不同,本文主要考慮更具一般性的正則化矩陣為單位陣時(shí)的正則化方法。 1.2 正則化參數(shù)影響 在正則化矩陣為單位矩陣時(shí),影響正則化方法解算質(zhì)量的關(guān)鍵因素是正則化參數(shù)的選擇?;贚曲線法確定的正則化參數(shù)具有較好的穩(wěn)定性與可靠性,是應(yīng)用較為廣泛的方法[25],但研究表明,由L曲線法確定的正則化參數(shù)存在過(guò)度平滑現(xiàn)象,降低了模型參數(shù)的估計(jì)精度[16]。由于正則化方法是一種有偏估計(jì)方法,是均方誤差優(yōu)于無(wú)偏估計(jì)的方法[20-21]。從降低均方誤差的角度考慮優(yōu)化正則化參數(shù),對(duì)于改善L曲線法正則化參數(shù)過(guò)度平滑性,提高模型參數(shù)估計(jì)精度具有重要意義。 有偏估計(jì)均方誤差表示為[19-20] (3) 式中,Mα表示均方誤差;E表示期望運(yùn)算;表示未知模型參數(shù)真值;Tα表示正則化模型參數(shù)估值方差;bα表示模型參數(shù)估值偏差。由式(3)可以看出,正則化法的均方誤差應(yīng)由方差和偏差組成。對(duì)正則化法的方差與偏差進(jìn)行分析,由協(xié)方差傳播律可得正則化估計(jì)方差-協(xié)方差矩陣為 (4) 式中,Cα表示方差-協(xié)方差矩陣;αL表示由L曲線法確定的正則化參數(shù);對(duì)設(shè)計(jì)矩陣A進(jìn)行奇異值分解 (5) (6) 式中,U表示左奇異向量矩陣;S表示奇異值矩陣;G表示右奇異向量矩陣;γ表示奇異值,γ1>γ2>…>γn>0。對(duì)Cα求跡,可得正則化估計(jì)方差為 (7) 由式(7)可以看出,正則化法可有效降低模型參數(shù)的估值方差,方差降低程度與正則化參數(shù)αL有關(guān),正則化參數(shù)越大,方差越小,反之,正則化參數(shù)越小,方差越大。 由式(2)計(jì)算正則化估計(jì)偏差為 (8) (9) 式中,gi表示對(duì)應(yīng)于奇異值γi的右奇異向量。由式(9)可以看出,正則化偏差同樣與正則化參數(shù)有關(guān),正則化參數(shù)越大,偏差越大,反之,正則化參數(shù)越小,偏差越小。 正則化參數(shù)與估計(jì)方差成反比,與估計(jì)偏差成正比,因此,在均方誤差意義下,存在一個(gè)最優(yōu)的正則化參數(shù),使正則化估計(jì)的均方誤差最小。通過(guò)式(3)、式(7)以及式(9)可計(jì)算出不同正則化參數(shù)時(shí)的均方誤差,進(jìn)而確定出均方誤差最小時(shí)的正則化參數(shù)。然而,由式(9)可知,偏差的計(jì)算需要獲知未知模型參數(shù)的真值,在實(shí)際應(yīng)用中,模型參數(shù)真值是未知的,且受病態(tài)性影響,模型參數(shù)的可靠估值也難以獲得,以不可靠估值代替真值計(jì)算偏差,常導(dǎo)致均方誤差計(jì)算錯(cuò)誤,無(wú)法確定出最小均方誤差以及相應(yīng)的正則化參數(shù)。 1.3 基于均方誤差最小準(zhǔn)則的正則化參數(shù)優(yōu)化方法 由式(9)可以看出,若準(zhǔn)確估計(jì)出模型參數(shù)在各特征向量方向上的投影值,即可有效計(jì)算均方誤差。由最小二乘估計(jì)可得投影值的估值為 (10) 式中,gi表示對(duì)應(yīng)于奇異值γi的右奇異向量,ui為對(duì)應(yīng)的左奇異向量。由協(xié)方差傳播律可得投影值的估計(jì)方差 (11) 由式(11)可見(jiàn),的方差與奇異值大小有關(guān),奇異值越大,方差越小,則對(duì)應(yīng)的投影值估值越準(zhǔn)確;同理,奇異值越小,方差越大,投影值估值可靠性越差。結(jié)合式(9)可見(jiàn),對(duì)于奇異值矩陣中部分較大的奇異值,可準(zhǔn)確的估計(jì)出來(lái),那么相應(yīng)部分的均方誤差也可準(zhǔn)確地計(jì)算出來(lái)。利用該部分較為可靠的均方誤差可有效確定出合理的正則化參數(shù)。然而,對(duì)于奇異值矩陣中部分較小的奇異值,的方差較大,準(zhǔn)確性較低,均方誤差計(jì)算不可靠,難以確定合理的正則化參數(shù)。 綜合分析式(7)、式(9)與正則化參數(shù)、奇異值的相互影響關(guān)系,由式(7)可知,在奇異值較小時(shí),較小的正則化參數(shù)即可較大程度地降低估計(jì)方差,在奇異值接近于0時(shí),γi2/(γi2+αL)2值也接近于0,那么方差也幾近為0。由式(9)可見(jiàn),在奇異值較小時(shí),αL2/(γi2+αL)2接近于1,引入偏差大小主要由模型參數(shù)投影值決定。因此,對(duì)于較小的奇異值,正則化參數(shù)對(duì)方差與偏差的影響也相對(duì)較小。 綜上所述,針對(duì)設(shè)計(jì)矩陣不同大小奇異值,將均方誤差按奇異值大小分塊計(jì)算,利用較大奇異值部分的可靠的均方誤差計(jì)算值,依據(jù)均方誤差最小準(zhǔn)則,可有效對(duì)已確定的正則化參數(shù)進(jìn)行優(yōu)化,從而提高模型參數(shù)估計(jì)精度。以優(yōu)化L曲線正則化參數(shù)為基礎(chǔ),正則化參數(shù)優(yōu)化方法具體流程如下: (1) 利用L曲線法確定正則化參數(shù)αL,以的最小二乘估值代替真值,計(jì)算各奇異值對(duì)應(yīng)的均方誤差,即:(γi2+αL)2。記作:ML= mL1, mL2, …, mLn。 (2) 利用最小二乘估值代替真值,計(jì)算均方誤差,基于均方誤差最小準(zhǔn)則確定各奇異值對(duì)應(yīng)的正則化參數(shù)αi,而后計(jì)算各奇異值對(duì)應(yīng)的均方誤差,即:αi)2。記作:MS= [mS1, mS2, …, mSn]。 (3) 對(duì)比ML與MS向量,理論上,在mL與mS相差較大時(shí),表明L曲線法確定的正則化參數(shù)不能合理地降低均方誤差,需對(duì)正則化參數(shù)進(jìn)行優(yōu)化。以mL/mS比值為判斷指標(biāo)可有效反映各奇異值對(duì)應(yīng)的均方誤差差異,比值較大時(shí),表明由L曲線法確定的正則化參數(shù)未能高效地降低該部分均方誤差,需對(duì)正則化參數(shù)進(jìn)行優(yōu)化。 然而,在奇異值較小時(shí),估值方差較大,mL與mS的計(jì)算值可靠性較低;此外,奇異值較小時(shí),正則化參數(shù)對(duì)均方誤差的影響變小,估值影響變大,在ML與MS均由最小二乘估計(jì)的計(jì)算得到時(shí),mL/mS比值也相差較?。慌袛嘀笜?biāo)閾值難以合理確定。但是,在奇異值較大時(shí),的估值方差較小,估值較為準(zhǔn)確,均方誤差受正則化參數(shù)的影響較大,mL/mS比值則相差較大。因此,對(duì)正則化參數(shù)的優(yōu)化僅在奇異值較大部分。 在奇異值較大時(shí),由于mL與mS值受正則化參數(shù)與值的共同影響,mLi/mSi比值會(huì)呈現(xiàn)不規(guī)則波動(dòng),波峰越大,mL與mS差異越大,正則化參數(shù)優(yōu)化后,均方誤差改善程度越大,波谷越小,mL與mS差異較小,優(yōu)化后均方誤差變化較小,優(yōu)化與否對(duì)結(jié)果影響也較小。由此表明,波峰越多,波動(dòng)越大區(qū)域,正則化參數(shù)優(yōu)化效果越好。因此,選取波峰較多,波動(dòng)較大區(qū)域的奇異值對(duì)應(yīng)的正則化參數(shù)進(jìn)行優(yōu)化。實(shí)際應(yīng)用中,同一觀測(cè)模型,相同未知參數(shù)下的觀測(cè)方程系數(shù)矩陣奇異值變化情況相似,可容易確定出需進(jìn)行正則化參數(shù)優(yōu)化的奇異值部分。 以mLi/mSi比值波動(dòng)情況選取奇異值進(jìn)行正則化參數(shù)優(yōu)化,最終的正則化參數(shù)優(yōu)化為αm=diag α1 α2 … αi αL … αL。 (4) 將優(yōu)化后的正則化參數(shù)引入正則化法,估計(jì)模型參數(shù),得到模型參數(shù)正則化估值為 (12) 2 試驗(yàn)分析2.1 數(shù)值模擬試驗(yàn)分析 Fredholm第一類積分方程是數(shù)據(jù)處理中典型的病態(tài)問(wèn)題,大地測(cè)量中的地球重力場(chǎng)反演實(shí)質(zhì)上就是對(duì)該方程的解算。該積分方程表達(dá)為 (13) 式中,z(y)表示觀測(cè)值。其核函數(shù)K(x, y)表示為 (14) 精確解函數(shù)為 (15) 式中,β1=-(x-0.3)2/0.03,β2=-(x-0.7)2/0.03,x∈ 0, 1,y∈ -2, 2。以采樣間隔Δx=Δy=0.02對(duì)式(13)積分方程進(jìn)行離散化處理,得到201×51維設(shè)計(jì)矩陣以及1×51維未知參數(shù)。為驗(yàn)證算法的穩(wěn)定性,在觀測(cè)量z(y)中引入分布為N(0,2e-03)的高斯噪聲干擾,模擬試驗(yàn)300次,得到未知參數(shù)估值的統(tǒng)計(jì)結(jié)果。 為便于對(duì)比分析,模型方程分別采用最小二乘估計(jì)方法、正則化方法進(jìn)行解算。其中正則化方法包括L曲線法確定正則化參數(shù)的正則化法、最小MSE法確定正則化參數(shù)的正則化法[17]、偏差改正的正則化法[21]及正則化參數(shù)優(yōu)化的正則化法。 圖 1給出了由L曲線法及均方誤差分塊最小法確定正則化參數(shù)時(shí),各奇異值對(duì)應(yīng)的均方誤差比值情況。從圖中矩形區(qū)域可以看出,均方誤差存在較大差異主要出現(xiàn)在前5個(gè)奇異值區(qū)域,即由L曲線法確定正則化參數(shù)時(shí),模型參數(shù)正則化估值均方誤差遠(yuǎn)大于由均方誤差分塊最小法確定正則化參數(shù)。由此可見(jiàn),需對(duì)前5個(gè)奇異值對(duì)應(yīng)的正則化參數(shù)采用均方誤差分塊最小法進(jìn)行優(yōu)化。各方法的模型參數(shù)估計(jì)誤差情況如圖 2所示。
圖 2給出了各方法300次試驗(yàn)的均方根誤差變化情況。由圖 2(b)可以看出,受病態(tài)性的影響,最小二乘估計(jì)RMSE(root mean square error)較大,已無(wú)法得到參數(shù)的有效估值。由圖 2(a)可見(jiàn),L曲線法確定正則化參數(shù)的正則化法,有效降低了模型參數(shù)估值RMSE,提高了估計(jì)精度,且具有較好的穩(wěn)定性,但相比于其余3種基于均方誤差最小準(zhǔn)則的改進(jìn)正則化法估計(jì)結(jié)果,模型參數(shù)估值RMSE明顯較大,由此表明3種改進(jìn)方法不同程度地改善了正則化估計(jì)質(zhì)量。其中,偏差改正的正則化法參數(shù)估計(jì)結(jié)果整體優(yōu)于最小MSE確定正則化參數(shù)的正則化法,而正則化參數(shù)優(yōu)化的正則化法估計(jì)結(jié)果優(yōu)于偏差改正法,為三者中最優(yōu)估計(jì)。各方法的RMSE統(tǒng)計(jì)結(jié)果見(jiàn)表 1。 表 1 各方法模型參數(shù)估值RMSE統(tǒng)計(jì)結(jié)果Tab. 1 Statistical results of estimation errors
表選項(xiàng) 由表中可得,正則化方法有效改善了最小二乘估計(jì)結(jié)果,降低了估計(jì)均方根誤差。在正則化參數(shù)由L曲線法確定時(shí),由其RMSE最大值、最小值以及平均值可以看出,正則化估計(jì)結(jié)果具有較好的穩(wěn)定性,但相比于其余正則化方法,RMSE偏高,表明L曲線確定正則化參數(shù)存在過(guò)度平滑問(wèn)題,影響了模型參數(shù)估計(jì)質(zhì)量。3種基于均方誤差最小準(zhǔn)則對(duì)正則化方法的改進(jìn)均有效提高了模型參數(shù)估計(jì)精度,其中,正則化參數(shù)優(yōu)化方法表現(xiàn)最優(yōu),其RMSE統(tǒng)計(jì)值最小,且計(jì)算用時(shí)最少,效率最高。由此數(shù)值試驗(yàn)結(jié)果表明,新方法可有效改善正則化法模型參數(shù)估計(jì)結(jié)果。 2.2 PolInSAR植被高估計(jì)試驗(yàn)分析 由于受到基線長(zhǎng)度以及觀測(cè)幾何條件的影響,利用PolInSAR數(shù)據(jù)進(jìn)行植被高反演時(shí),反演模型常出現(xiàn)病態(tài)問(wèn)題[26-27],為了驗(yàn)證本文方法的可行性與有效性,選取了德國(guó)宇航局BioSAR2008項(xiàng)目的E-SAR P波段全極化數(shù)據(jù)進(jìn)行植被高度反演試驗(yàn)。時(shí)間基線53 min,空間基線24 m,選用HH、HV、VV、HHpVV、HHmVV、opt1、opt2、opt3、PDHigh、PDLow 10種極化方式對(duì)應(yīng)的復(fù)相干系數(shù)作為觀測(cè)值,構(gòu)建觀測(cè)方程,進(jìn)行植被高參數(shù)反演。 與數(shù)值模擬試驗(yàn)相同,本次試驗(yàn)依然采用最小二乘估計(jì)方法、正則化方法解算觀測(cè)方程。其中正則化方法包括L曲線法確定正則化參數(shù)的正則化法、最小MSE法確定正則化參數(shù)的正則化法[17]、偏差改正的正則化法[21]及正則化參數(shù)優(yōu)化的正則化法。 圖 3給出了L曲線確定正則化參數(shù)與均方誤差分塊最小法確定正則化參數(shù)時(shí),各奇異值對(duì)應(yīng)均方誤差比值情況。由圖中矩形區(qū)域可見(jiàn),前4個(gè)奇異值對(duì)應(yīng)的均方誤差比值波動(dòng)較大,表明由L曲線確定的正則化參數(shù)在前4個(gè)奇異值區(qū)域,未能合理有效的降低均方誤差,因此,利用均方誤差分塊最小法優(yōu)化前4個(gè)奇異值對(duì)應(yīng)的正則化參數(shù)。各方法的植被高反演結(jié)果如圖 4所示。
圖 4中,三階段算法為PolInSAR植被高反演常用方法,其反演結(jié)果作為正則化法模型參數(shù)初值,LiDAR植被高反演結(jié)果具有較高的反演精度,可看作是模型參數(shù)的真值。對(duì)比圖中不同方法的反演結(jié)果可見(jiàn),L曲線確定正則化參數(shù)的正則化法的植被高反演結(jié)果優(yōu)于三階段法,3種基于均方誤差最小準(zhǔn)則的改進(jìn)正則化法反演結(jié)果優(yōu)于L曲線法確定正則化參數(shù)的正則化法,3種方法中,正則化參數(shù)優(yōu)化的正則化法反演結(jié)果優(yōu)于其余兩者。為了定量分析不同反演結(jié)果,在圖中均勻選取1550塊樣地,計(jì)算各方法的植被高反演均方根誤差列于表 2。 表 2 不同方法植被高參數(shù)反演結(jié)果Tab. 2 Statistical results of estimation errors
表選項(xiàng) 由表 2可以看出,L曲線確定正則化參數(shù)的正則化法植被高反演均方根誤差相比于三階段算法降低了17.5%,有效改善了三階段法反演結(jié)果。而3種基于均方誤差最小準(zhǔn)則的改進(jìn)方法反演結(jié)果相比于L曲線法,均方根誤差分別下降了15.1%、19.7%及24.3%,有效改善了L曲線法反演結(jié)果。其中,正則化參數(shù)優(yōu)化的正則化法反演結(jié)果最優(yōu)。在計(jì)算效率上,相比于最小MSE法與偏差改正法,正則化參數(shù)優(yōu)化法用時(shí)最少,計(jì)算效率有一定程度提高。對(duì)1550塊樣地的反演誤差進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)結(jié)果如圖 5所示。
三階段算法的反演誤差主要集中于-8~-5 m,L曲線-正則化法反演誤差集中于-5~-2 m,最小MSE-正則化法反演誤差集中于-4~-1 m,偏差改正-正則化法反演誤差集中于-3~0 m,正則化參數(shù)優(yōu)化-正則化法的反演誤差集中于-2~1 m。由此可見(jiàn),三階段算法植被高反演結(jié)果存在嚴(yán)重的低估問(wèn)題,采用正則化方法進(jìn)行反演,低估問(wèn)題得到了改善,其中正則化參數(shù)優(yōu)化的正則化法相較于其他正則化法改善程度最大,反演誤差期望值在-0.5 m。因此,樣地反演誤差統(tǒng)計(jì)結(jié)果進(jìn)一步體現(xiàn)了正則化參數(shù)優(yōu)化方法的可行性和有效性。 數(shù)值模擬試驗(yàn)與PolInSAR植被高反演試驗(yàn)結(jié)果表明,基于均方誤差最小準(zhǔn)則改進(jìn)正則化方法,可有效實(shí)現(xiàn)模型參數(shù)估計(jì)質(zhì)量的改善。均方誤差最小法確定正則化參數(shù)及偏差改正法均是行之有效的正則化改進(jìn)方法,兩種方法均以模型參數(shù)初始估值為參數(shù)真值,通過(guò)迭代方法計(jì)算均方誤差,實(shí)現(xiàn)均方誤差最小化,然而受病態(tài)性影響,模型參數(shù)初值估計(jì)精度難以保證,影響了均方誤差計(jì)算的可靠性,從而限制了正則化方法改善程度。正則化參數(shù)優(yōu)化方法利用SVD分解技術(shù)分塊計(jì)算均方誤差,選取計(jì)算可靠的均方誤差,基于最小化準(zhǔn)則優(yōu)化正則化參數(shù),從而降低了參數(shù)初值影響,更為合理可靠的改善正則化解算質(zhì)量。 3 結(jié)論 正則化方法是大地測(cè)量中應(yīng)用最為廣泛的病態(tài)問(wèn)題解算方法之一。然而,正則化方法中,正則化參數(shù)的選擇一直是影響正則化法解算效果的難題。常用的正則化參數(shù)確定方法從不同角度提出,但均難以獲得最優(yōu)的正則化參數(shù)。本文從降低模型參數(shù)估值均方誤差的角度,提出了一種正則化參數(shù)優(yōu)化方法?;谄娈愔捣纸饧夹g(shù),將均方誤差按奇異值大小分塊計(jì)算,利用可準(zhǔn)確計(jì)算的均方誤差優(yōu)化L曲線正則化參數(shù),有效避免了迭代計(jì)算中參數(shù)初值不可靠對(duì)均方誤差計(jì)算的影響,合理實(shí)現(xiàn)了模型參數(shù)估值均方誤差的降低。數(shù)值模擬試驗(yàn)與PolInSAR植被高反演試驗(yàn)結(jié)果表明,對(duì)正則化參數(shù)的優(yōu)化可有效改善正則化法解算質(zhì)量,提高模型參數(shù)估計(jì)精度。 【引文格式】林東方, 朱建軍, 付海強(qiáng), 等. 均方誤差意義下的正則化參數(shù)二次優(yōu)化方法. 測(cè)繪學(xué)報(bào),2020,49(4):443-451. DOI: 10.11947/j.AGCS.2020.20190148 |
|