為了實現(xiàn)自主飛行,無人機需要捕捉到環(huán)境中的感知信號,并根據(jù)這些信息做出決定。卡耐基梅隆大學(xué)的研究人員開發(fā)了一種新方法,允許無人機分別學(xué)習(xí)感知和行動。這種分兩階段的方法克服了“模擬與現(xiàn)實之間的差距”,并創(chuàng)造了一種將完全根據(jù)模擬數(shù)據(jù)訓(xùn)練的無人機安全地部署到真實世界的航向?qū)Ш降姆椒ā?/p>
計算機科學(xué)學(xué)院機器人研究所的博士生Rogerio Bonatti說:“通常情況下,即使是在最逼真的模擬數(shù)據(jù)上訓(xùn)練的無人機,在現(xiàn)實世界中也會失敗,因為光線、顏色和紋理的差異仍然太大,難以翻譯?!薄拔覀兊母兄K接受了兩種模式的訓(xùn)練,以增強對環(huán)境變化的應(yīng)變力?!?/p>
第一個幫助訓(xùn)練無人機感知能力的模式是圖像。研究人員使用逼真的模擬器創(chuàng)建了一個環(huán)境,其中包括無人機、足球場和從地面升起的紅場大門,并隨機定位以創(chuàng)建軌跡。然后,他們從成千上萬隨機生成的無人機和柵極配置中建立了一個模擬圖像的大型數(shù)據(jù)集。
感知所需的第二個模態(tài)是了解門在空間中的位置和方向,研究人員利用模擬圖像數(shù)據(jù)集完成了這一任務(wù)。
使用多種模式對模型進行教學(xué),增強了對無人機經(jīng)驗的有力描述,這意味著它可以理解場和門的本質(zhì),從而從模擬轉(zhuǎn)化為現(xiàn)實。壓縮圖像以減少像素有助于此過程。通過對低維表示的學(xué)習(xí),可以使模型看穿現(xiàn)實世界中的視覺噪聲并識別出大門。
在感知學(xué)習(xí)后,研究人員將無人機部署在模擬環(huán)境中,這樣它就可以學(xué)習(xí)它的控制策略——或者如何實際移動。在這種情況下,它學(xué)習(xí)應(yīng)用何種速度,因為它導(dǎo)航的過程和遇到每個門。因為這是一個模擬環(huán)境,一個程序可以在部署前計算出無人機的最佳飛行軌跡。這種方法比使用專家操作人員的手動監(jiān)督學(xué)習(xí)具有優(yōu)勢,因為真實世界的學(xué)習(xí)可能是危險的、耗時的和昂貴的。
無人機通過研究人員指定的訓(xùn)練步驟來學(xué)習(xí)導(dǎo)航課程。博納蒂表示,他對無人機在現(xiàn)實世界中所需要的特定操縱能力和方向提出了挑戰(zhàn)?!拔易専o人機以不同的軌跡形狀向左和向右轉(zhuǎn)彎,隨著噪音的增加,轉(zhuǎn)彎難度會加大。”機器人并沒有學(xué)習(xí)如何重新穿越任何特定的軌跡。相反,通過有策略地指導(dǎo)模擬的無人機,它會學(xué)習(xí)所有的元素和動作類型,從而自主地比賽?!?/p>
博納蒂希望推動現(xiàn)有技術(shù)來接近人類解讀環(huán)境線索的能力。
博納蒂說,“到目前為止,無人駕駛賽車的大部分工作都集中于設(shè)計一個系統(tǒng),該系統(tǒng)以速度為唯一目標(biāo),并配備了額外的傳感器和軟件。取而代之,我們旨在創(chuàng)造一種受人腦功能啟發(fā)的計算結(jié)構(gòu),通過潛在的表示將視覺信息映射到正確的控制動作中。”
但無人機競賽只是這種學(xué)習(xí)方式的一種可能。這種分離感知和控制的方法可以應(yīng)用于許多不同的人工智能任務(wù),如駕駛或烹飪。雖然這個模型依賴于圖像和位置來教授感知能力,但其他的模式,如聲音和形狀,可以用于識別汽車、野生動物或物體。
2025-09-04 21:58
2025-08-28 11:13
2025-08-27 14:14
2025-08-26 13:50
2025-08-23 20:37
2025-08-22 10:33
2025-08-18 14:20
2025-08-13 11:12
2025-08-13 10:55
2025-08-08 09:53