焉知焉知·焉能不知 文章來自:同濟(jì)智能汽車研究所(集成與控制研究室)
編者按:隨著自動駕駛控制的發(fā)展,越來越多的人工智能或者機(jī)器學(xué)習(xí)的算法被應(yīng)用在智能汽車底盤動力學(xué)控制器設(shè)計(jì)當(dāng)中。由于實(shí)際車輛動力學(xué)系統(tǒng)的復(fù)雜性,控制器設(shè)計(jì)過程中往往忽略了系統(tǒng)的高階動態(tài)以及非線性特性,導(dǎo)致車輛跟蹤性能的降低。而智能算法恰恰能夠補(bǔ)償車輛動力學(xué)特性的變化,在一定程度上提高自動駕駛性能。文章通過一個(gè)簡單的轉(zhuǎn)角控制例子,驗(yàn)證了迭代學(xué)習(xí)算法在自動駕駛運(yùn)動控制中的應(yīng)用,值得借鑒。
摘要:自動駕駛車輛能夠通過激進(jìn)的駕駛操作在極限條件下盡可能地利用輪胎與路面間的附著能力,從而保持車輛的行駛能力。然而,在附著極限的條件下,車輛動力學(xué)的高度非線性和建模難度使控制器設(shè)計(jì)變得更加困難。其中,一種提高車輛的參考路徑跟蹤性能的可行辦法是通過重復(fù)相同的操作,利用迭代學(xué)習(xí)控制(ILC)算法確定合適的瞬態(tài)轉(zhuǎn)向控制輸入?yún)?shù)。為探究這一概念的可能性,文章將學(xué)習(xí)算法應(yīng)用在自動駕駛賽車的路徑跟蹤中。對ILC而言,賽車是一種理想的應(yīng)用場景。因?yàn)橘愜嚂诟街鴺O限下沿著同一賽道反復(fù)行駛,從而產(chǎn)生多組可復(fù)現(xiàn)的非線性車輛動力學(xué)數(shù)據(jù)。仿真結(jié)果被用于設(shè)計(jì)和驗(yàn)證PD和二次最優(yōu)迭代學(xué)習(xí)控制算法的收斂性,而奧迪TTS賽車在加州雷山賽道的試驗(yàn)結(jié)果也將在下文中展現(xiàn)。結(jié)果表明,這兩種算法都可以修正路徑跟蹤的瞬態(tài)誤差,并顯著提高參考前饋控制器的性能。
1前言 隨著感知技術(shù)和線控技術(shù)的發(fā)展,相較于傳統(tǒng)人類駕駛員,自動駕駛車輛能夠在緊急情況下對車輛進(jìn)行合理干預(yù),從而提高安全性。類似的情況包括緊急避障[1]和由于駕駛員的誤操作引起的車輛打滑[2]。而在極限條件下駕駛操作的最大難點(diǎn)在于路徑跟蹤過程中車輛的附著條件和轉(zhuǎn)向響應(yīng)呈現(xiàn)高度非線性。并且,一些難以測量的干擾(如路面傾角、坡度、局部附著系數(shù)突變…)對車輛的瞬態(tài)響應(yīng)都有很大影響[3]。
本文在自動駕駛賽車的特定場景中實(shí)現(xiàn)迭代轉(zhuǎn)向控制算法的應(yīng)用。由于賽車在相同的賽道上循環(huán)行駛,并且行駛工況都迫近路面附著極限,賽車成為自動駕駛初期迭代學(xué)習(xí)控制的理想對象和場景。因?yàn)槊恳蝗惖赖膮⒖悸窂角识急3植蛔?,系統(tǒng)的未知擾動和車輛的動力學(xué)特性被認(rèn)為是可復(fù)現(xiàn)的,并且可以用ILC算法進(jìn)行補(bǔ)償。然而,值得一提的是,當(dāng)車輛由于前軸輪胎力喪失而產(chǎn)生強(qiáng)烈的不足轉(zhuǎn)向時(shí),控制器不能有效控制車輛的行駛。在這種情況下,附加額外的轉(zhuǎn)角對車輛的軌跡跟蹤不會再有任何作用,因此,車輛的目標(biāo)車速和轉(zhuǎn)向曲率都需要進(jìn)行修正。
文章架構(gòu)如下:第二部分介紹了賽車跟蹤參考路徑時(shí)的平面線性模型。因?yàn)榉较虮P轉(zhuǎn)角輸入和車輛的路徑跟蹤誤差之間的傳遞函數(shù)是開環(huán)不穩(wěn)定的,所以需要在轉(zhuǎn)向控制系統(tǒng)中加入一個(gè)車道保持的穩(wěn)定性控制系統(tǒng),而閉環(huán)的動力學(xué)系統(tǒng)將在所謂的“l(fā)ifted-domain”中體現(xiàn)。第三部分提出了一個(gè)PD-ILC控制,并設(shè)計(jì)了一個(gè)低通濾波器來加速控制系統(tǒng)的收斂。利用“l(fā)ifted-domain”的辦法調(diào)整控制增益和小側(cè)向的系統(tǒng)穩(wěn)定性,而在大側(cè)向工況下則利用非線性仿真預(yù)測期望的系統(tǒng)跟蹤響應(yīng)。第四部分提出了一個(gè)基于二次最優(yōu)的Q-ILC控制器,可以準(zhǔn)確地考慮車輛的速度變化。第五部分給出了在奧迪TTS試驗(yàn)平臺車輛上加速度接近0.8g的時(shí)候兩種控制器的試驗(yàn)數(shù)據(jù)。
2車輛系統(tǒng)動力學(xué)和問題概述 本文中,自動駕駛車輛用最小時(shí)間沿著給定賽道行駛的控制目標(biāo)分為側(cè)向運(yùn)動控制問題和縱向運(yùn)動控制問題。側(cè)向控制器利用方向盤轉(zhuǎn)角輸入跟蹤參考軌跡(圖1.a)。賽道一般以曲率沿著距離的變化表示(圖1.b)。對于雷山賽道,可以利用文獻(xiàn)[7]的辦法計(jì)算最高速度和曲率的分布圖。另外,車速跟蹤控制器[8]不受ILC控制器的影響。 圖 1.a Thunderhill Raceway 圖 1.b 曲率與速度分布圖 A.側(cè)向車輛動力學(xué) 圖2.a給出車輛跟蹤給定曲率路徑的示意圖。車輛偏離期望路徑的側(cè)向位移誤差e是ILC算法的測量輸出。由于ILC控制器需要通過數(shù)次迭代來確定合適的前饋控制輸入,因此,要求系統(tǒng)的控制輸入和控制輸出之間滿足漸進(jìn)穩(wěn)定的關(guān)系。對于主動轉(zhuǎn)向控制系統(tǒng),轉(zhuǎn)角和側(cè)向位移誤差的傳遞函數(shù)可以由原點(diǎn)處的兩個(gè)極點(diǎn)表征,因此需要一個(gè)額外的反饋穩(wěn)定性控制器。 圖 2 二自由度平面車輛軌跡跟蹤模型 本文利用預(yù)瞄控制作為系統(tǒng)的反饋穩(wěn)定性控制器。預(yù)瞄誤差定義為: 其中,△Ψ是車輛的航向角誤差,XLA是預(yù)瞄距離,一般約5-20m。反饋控制律為: kp為比例增益系數(shù)。控制律(2)是由一般的車道保持控制算法拓展得到的,文獻(xiàn)[9]給出了kp和xLA的選擇方法。文獻(xiàn)[10]證明了在輪胎力飽和情況下該系統(tǒng)的穩(wěn)定性。
通過增加反饋控制器,側(cè)向位移誤差的閉環(huán)動力學(xué)系統(tǒng)取決于三個(gè)狀態(tài):車輛側(cè)偏角、橫擺角速度以及航向角誤差。車輛平面運(yùn)動的系統(tǒng)動力學(xué)模型如下: 由于自動駕駛賽車常常行駛在輪胎的附著極限邊緣,側(cè)向力通過非線性的Fiala刷子輪胎模型進(jìn)行建模,并假設(shè)附著系數(shù)不變以及輪胎力的拋物線假設(shè)[11]。前后軸的側(cè)向力分別是前后輪胎側(cè)偏角的函數(shù),如式(4)所示。 線性輪胎側(cè)偏角通過式(5)計(jì)算得到。 B.“l(fā)ifted-domain”中的線性時(shí)變模型 雖然式(4)的非線性輪胎模型能夠較好地反映極限工況下的輪胎力飽和現(xiàn)象,但是本文設(shè)計(jì)的兩個(gè)ILC控制器需要一個(gè)線性系統(tǒng)假設(shè)。因此,在小側(cè)向工況下,簡單的線性輪胎模型如下: 線性時(shí)變模型考慮了車輛前進(jìn)速度的變化。盡管式(3)中缺乏車輛的縱向動力學(xué)模型,考慮速度變化后能夠讓系統(tǒng)動力學(xué)控制更加精確。時(shí)變狀態(tài)空間矩陣為: 假設(shè)每一圈的擾動都保持一致: 將系統(tǒng)離散化后得到: k是時(shí)間采樣下標(biāo),j是圈數(shù)。將系統(tǒng)動力學(xué)方程在“l(fā)ifted-domain”中表示能夠有利于ILC控制器的設(shè)計(jì)。 假設(shè)車速不變的話,我們將得到一個(gè)只有N個(gè)元素的線性時(shí)不變系統(tǒng),因此P矩陣將會成為一個(gè)托普利茲矩陣。 3控制器設(shè)計(jì) 在獲得了上一圈的轉(zhuǎn)向動態(tài)和完整的位移誤差數(shù)據(jù)之后,下一步就是設(shè)計(jì)控制算法來確定下一圈的轉(zhuǎn)角控制輸入。如文獻(xiàn)[12],采用常規(guī)的迭代學(xué)習(xí)算法框架來確定轉(zhuǎn)角輸入: 其中,Q是濾波矩陣,L是學(xué)習(xí)矩陣。在下一節(jié)中,Q和L矩陣將通過PD類型的ILC控制器和二次最優(yōu)Q-ILC控制器得到。 A.比例-微分PD控制器 PD-ILC控制器通過前一圈的側(cè)向位移誤差和誤差微分?jǐn)?shù)據(jù)計(jì)算得到當(dāng)前的轉(zhuǎn)角輸入: 通過式(16)得到學(xué)習(xí)矩陣L為: 在選擇比例增益系數(shù)和微分增益系數(shù)的時(shí)候需要避免每一圈之間的瞬態(tài)響應(yīng)變差,同時(shí)需要避免在最終收斂之前初期的路徑跟蹤誤差快速增大。這是ILC控制器設(shè)計(jì)過程中的一般要求,可以通過滿足一定的單調(diào)收斂條件[12]來保證。 其中,σ是最大特征值。如此,γ給出了每一圈路徑跟蹤誤差變化的上限值。 圖3中給出未經(jīng)濾波PD控制器(Q=I)和經(jīng)過一個(gè)2Hz低通濾波PD控制器的不同γ值。圖中,γ的取值為kp和kd控制器參數(shù)的各等高線。低通濾波器通過排除微小跟蹤誤差引起的控制輸入振蕩來保證系統(tǒng)的單調(diào)穩(wěn)定性。由于濾波是作用在下一圈的控制輸入信號中,因此可以認(rèn)為是零相位的。 圖 3 控制器參數(shù)分布圖 但是,測試系統(tǒng)的線性穩(wěn)定性對于控制器的設(shè)計(jì)來說是不夠的,因?yàn)橘愜囃旭傇诟街鴺O限邊緣,此時(shí)車輛的動力學(xué)特性為高度非線性的。為了測試PD控制器的可行性,利用圖1 的曲率和速度圖進(jìn)行多圈的仿真來驗(yàn)證車輛的路徑跟蹤性能。圖4給出了線性模型和非線性模型的路徑跟蹤誤差的仿真結(jié)果均方根。結(jié)果表明,當(dāng)車輛行駛至極限條件時(shí),相比于期望的線性模型,ILC控制器的跟蹤性能有一定程度的弱化,但仍然滿足迭代收斂。 圖 4 PD-ILC控制器仿真結(jié)果 B.二次最優(yōu)控制器 另外一種方法是通過優(yōu)化代價(jià)函數(shù)確定下一圈的轉(zhuǎn)角控制輸入: 其中,T、R、S分別是對應(yīng)的權(quán)重矩陣。通過求解優(yōu)化問題可以計(jì)算出期望的控制器和濾波參數(shù)矩陣[13]: 相較于PD控制器,二次最優(yōu)控制器的優(yōu)點(diǎn)在于能夠考慮系統(tǒng)時(shí)變的動態(tài)P變化。這使得ILC控制器算法能夠補(bǔ)償由于車速變化引起的轉(zhuǎn)向動力學(xué)特性變化。但是,這也將給每一圈計(jì)算Q和L矩陣的時(shí)候帶來過大的運(yùn)算負(fù)擔(dān)。 圖5給出二次最優(yōu)控制器的仿真結(jié)果,其中T=R=I,S=100I。為簡化處理,選擇單位矩陣作為權(quán)重矩陣的初始值,并根據(jù)反復(fù)試驗(yàn)進(jìn)行調(diào)整。仿真結(jié)果與圖4的結(jié)果類似,在非線性輪胎動力學(xué)特性部分,控制器的性能有一定的惡化。但是,仿真結(jié)果仍然證明了控制器能夠保證側(cè)向位移跟蹤誤差的快速收斂,在側(cè)向加速度約0.8g的工況下,均方根誤差約為8-9cm。 圖 5 Q-ILC控制器仿真結(jié)果 4試驗(yàn)結(jié)果 以上兩種控制器均在加州雷山賽道上進(jìn)行了實(shí)車試驗(yàn)驗(yàn)證,并采集了相關(guān)試驗(yàn)數(shù)據(jù)。試驗(yàn)平臺車輛為奧迪TTS自動駕駛車輛,裝備了EPS電機(jī)、主動制動器和線控電子油門(圖6)。 圖 6 試驗(yàn)平臺 通過集成差分GPS系統(tǒng)和IMU傳感器紀(jì)錄車輛的狀態(tài)信息,并利用定位算法計(jì)算車輛的側(cè)向位移誤差、航向角誤差和行駛距離。轉(zhuǎn)角控制器的更新頻率為200Hz,數(shù)據(jù)采集頻率為10Hz,每一圈的數(shù)據(jù)都用于計(jì)算迭代學(xué)習(xí)的轉(zhuǎn)角控制輸入。然后利用插值查表的方式沿著行駛距離更新控制器的參數(shù)。為了保證車輛的穩(wěn)定性,利用基于穩(wěn)態(tài)前饋轉(zhuǎn)角控制算法[3]保證車輛的第一圈側(cè)向位移誤差不超過1m。
圖7給出PD-ILC控制器的控制輸入和跟蹤誤差。車輛的最大加速度為0.8g。在第一圈,盡管“前饋-反饋”控制器的采樣頻率很高,極限工況下輪胎的欠阻尼動力學(xué)特性仍然造成了跟蹤誤差的突變。但是,隨著兩三圈試驗(yàn)過后,迭代學(xué)習(xí)算法能夠有效減小跟蹤誤差。Q-ILC控制器的表現(xiàn)與此類似。
圖8是跟蹤不同加速度強(qiáng)度所需速度的結(jié)果。結(jié)果表明,在較小車輛加速度強(qiáng)度下,線性模型能夠較為準(zhǔn)確地表征車輛的動力學(xué)特性,“前饋-反饋”控制器能夠很好地跟蹤上期望的參考路徑,因此,迭代學(xué)習(xí)算法的改善空間較小。但是,隨著車速逐漸增加,輪胎的非線性特性增強(qiáng),路徑跟蹤性能也受到影響,此時(shí)迭代學(xué)習(xí)算法能夠有效地提高車輛的路徑跟蹤性能。實(shí)際結(jié)果表明,PD-ILC和Q-ILC的控制性能較為接近,而當(dāng)測試進(jìn)入結(jié)尾階段,路徑跟蹤誤差的均方根卻有輕微的增加。仿真結(jié)果中并沒有類似的現(xiàn)象,這可能是系統(tǒng)中每一圈未建模的傳感器噪聲和不同擾動造成的。通過調(diào)整增益矩陣中的參數(shù)應(yīng)該可以抑制這一現(xiàn)象,或者可以考慮在車輛性能收斂后停止迭代學(xué)習(xí)算法。 圖 7 PD-ILC控制器軌跡跟蹤試驗(yàn)結(jié)果,峰值側(cè)向加速度約為0.8g 圖 8 兩種控制器在不同加速度下的試驗(yàn)結(jié)果
5結(jié)論 本文驗(yàn)證了迭代學(xué)習(xí)控制算法在自動駕駛賽車轉(zhuǎn)角控制中的應(yīng)用。兩種迭代學(xué)習(xí)控制器PD-ILC和Q-ILC都經(jīng)過了仿真和試驗(yàn)驗(yàn)證,可以有效減小由于車輛極限工況下側(cè)向動力學(xué)高度非線性變化引起的側(cè)向位移跟蹤誤差。兩種控制器的性能表現(xiàn)接近,而PD-ILC方法的運(yùn)算負(fù)擔(dān)較輕,能夠滿足實(shí)時(shí)需求。雖然文章提出的控制器能夠滿足自動駕駛賽車在相同賽道上的路徑跟蹤需求,迭代學(xué)習(xí)算法在更多自動駕駛場景的應(yīng)用仍需要更多的研究工作。
6參考文獻(xiàn) [1] J. Funke and J. C. Gerdes, “Simpleclothoid paths for autonomous vehicle lane changes at the limits of handling,”in ASME 2013 Dynamic Systems and Control Conference. American Society ofMechanical Engineers, 2013, pp. V003T47A003–V003T47A003. [2] V. Turri, A. Carvalho, H. Tseng, K. H.Johansson, and F. Borrelli, “Linear model predictive control for lane keeping and obstacleavoidance on low curvature roads,” 2013. [3] N. R. Kapania and J. C. Gerdes, “Anautonomous lanekeeping system for vehicle path tracking and stability at thelimits of handling,” in 12th International Symposium on Advanced VehicleControl, 2014. [4] Y. Q. Chen and K. L. Moore, “Apractical iterative learning pathfollowing control of an omni-directionalvehicle,” Asian Journal of Control, vol. 4, no. 1, pp. 90–98, 2002. [5] H. Sun, Z. Hou, and D. Li, “Coordinatediterative learning control schemes for train trajectory tracking with overspeedprotection,” IEEE Trans. on Automation Science and Engineering, vol. 10, no. 2,pp. 323–333, 2013. [6] O. Purwin and R. DAndrea, “Performingand extending aggressive maneuvers using iterative learning control,” Roboticsand Autonomous Systems, vol. 59, no. 1, pp. 1–11, 2011. [7] P. A. Theodosis and J. C. Gerdes,“Generating a racing line for an autonomous racecar using professional drivingtechniques,” in Dynamic Systems and Control Conference, 2011, pp. 853–860. [8] K. Kritayakirana, “Autonomous vehiclecontrol at the limits of handling,” Ph.D. dissertation, Stanford University,2012. [9] E. J. Rossetter and J. C. Gerdes, “Astudy of lateral vehicle control under a virtual force framework,” in Proc.International Symposium on Advanced Vehicle Control, Hiroshima, Japan, 2002. [10] K. L. Talvala and J. C. Gerdes,“Lanekeeping at the limits of handling: Stability via lyapunov functions and acomparison with stability control,” in Dynamic Systems and Control Conference,2008, pp. 361– 368. [11] H. B. Pacejka, Tire and VehicleDynamics, 3rd ed. Butterworth-Heinemann, 2012. [12] D. A. Bristow, M. Tharayil, and A. G.Alleyne, “A survey of iterative learning control,” Control Systems, IEEE, vol.26, no. 3, pp. 96–114, 2006. [13] D. A. Bristow and B. Hencey, “A q,lfactorization of norm-optimal iterative learning control,” in 47th IEEEConference on Decision and Control, 2008. IEEE, 2008, pp. 2380–2384.
|
|