二、預(yù)測模型:幫助無人機(jī)不斷優(yōu)化飛行動(dòng)作
神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)預(yù)測模型以無人機(jī)當(dāng)前的狀態(tài)和動(dòng)作作為輸入。當(dāng)無人機(jī)裝載了有效載荷后,預(yù)測模型利用變分推斷(variational inference)方法,根據(jù)當(dāng)下有效載荷的質(zhì)量、系繩的長度等狀態(tài)參數(shù)快速推斷出后驗(yàn)概率,幫助無人機(jī)適應(yīng)新的飛行狀態(tài)。
該模型用長度為T的時(shí)序數(shù)據(jù)進(jìn)行訓(xùn)練,以此優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)重(weight)參數(shù)。研究人員假設(shè)有效載荷參數(shù)是未知的,用一個(gè)具有分布參數(shù)的潛變量(latent variable)K來表示它們,通過調(diào)整K值來模擬攜帶不同有效載荷的情況。
在模型訓(xùn)練階段,研究人員手動(dòng)駕駛載有不同有效載荷的無人機(jī)按照隨機(jī)軌跡飛行,并收集這部分訓(xùn)練數(shù)據(jù)。然后,研究人員運(yùn)行元學(xué)習(xí)方法,使模型學(xué)習(xí)共享的動(dòng)力學(xué)模型參數(shù)和對不同有效載荷的適應(yīng)參數(shù)。
然后,研究人員檢測模型的訓(xùn)練成果。模型利用當(dāng)前任務(wù)的所有數(shù)據(jù)在線推導(dǎo)出最優(yōu)潛變量?;趧?dòng)力學(xué)模型的控制器據(jù)此規(guī)劃無人機(jī)動(dòng)作,使無人機(jī)按照既定路線飛行。在整個(gè)飛行過程中,模型會(huì)持續(xù)儲(chǔ)存數(shù)據(jù),不斷推導(dǎo)出最優(yōu)潛變量、優(yōu)化無人機(jī)動(dòng)作,直至到達(dá)目的地。
三、無人機(jī)能負(fù)重完成躲避、裝卸貨任務(wù)
研究人員用四軸無人機(jī)進(jìn)行了演示。為了使無人機(jī)能夠自行定位航線,研究人員在無人機(jī)上搭載了攝像機(jī)模塊。
首先在設(shè)定飛行軌跡的情況下進(jìn)行演示。研究人員設(shè)定的飛行軌跡用紅色線條表示,模型實(shí)時(shí)規(guī)劃出的飛行軌跡用白色線條表示,無人機(jī)最終選擇的最佳飛行軌跡用藍(lán)色線條表示。根據(jù)模擬結(jié)果,無人機(jī)基本能夠按照指定路線飛行。
研究人員還在設(shè)定方形飛行軌跡和圓形飛行軌跡的情況下進(jìn)行了演示,并對比了元學(xué)習(xí)算法模型和其他模型。結(jié)果顯示,元學(xué)習(xí)算法模型的路線錯(cuò)誤更少。
研究人員還指出,隨著元學(xué)習(xí)算法不斷適應(yīng),無人機(jī)的飛行性能會(huì)繼續(xù)優(yōu)化。
在研究人員模擬出的幾種實(shí)際應(yīng)用場景中,無人機(jī)也較好地完成了任務(wù)。
1、躲避障礙物
2、撿拾、運(yùn)輸、卸下貨物
3、用指揮棒實(shí)時(shí)規(guī)劃飛行路線
4、跟蹤目標(biāo)飛行
結(jié)語:計(jì)劃進(jìn)一步提升模型自主性
Facebook和加州大學(xué)伯克利分校的研究人員利用基于模型的元強(qiáng)化學(xué)習(xí)方法,有效提升了無人機(jī)裝載有效載荷飛行的能力。
研究人員表示,將繼續(xù)進(jìn)行研究,致力于使無人機(jī)能夠完成更加復(fù)雜的有效載荷運(yùn)輸任務(wù)。根據(jù)論文,目前該模型還需要研究人員指定有效載荷被撿起和放下的時(shí)間。接下來研究人員計(jì)劃開發(fā)一種算法,使模型能夠自主決定裝卸貨的時(shí)間。
2025-09-17 10:55
2025-09-16 09:27
2025-09-12 11:30
2025-09-11 10:41
2025-09-09 10:52
2025-09-04 21:58
2025-08-28 11:13
2025-08-27 14:14
2025-08-26 13:50
2025-08-23 20:37