久久国产热视频,做做受视频播放试看30分钟,天天槽夜夜槽槽不停,天天槽夜夜槽槽不停,最近免费字幕中文大全

發(fā)布詢(xún)價(jià)單
您的位置:首頁(yè) > 資訊 > 綜合資訊 > 正文

當(dāng)無(wú)人機(jī)與視覺(jué)相遇?天津大學(xué)等發(fā)布最新「無(wú)人機(jī)視覺(jué)檢測(cè)和跟蹤」綜述論文:過(guò)去、現(xiàn)在和未來(lái)

2020-01-24 09:11 性質(zhì):轉(zhuǎn)載 作者:中國(guó)人工智能學(xué)會(huì)CAAI 來(lái)源:搜狐
免責(zé)聲明:無(wú)人機(jī)網(wǎng)(www.hldxsj.cn)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無(wú)關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來(lái)電商榷!)
【導(dǎo)讀】無(wú)人機(jī)計(jì)算機(jī)視覺(jué)相關(guān)檢測(cè)和跟蹤( Vision Meets Drones)作為近年來(lái)的研究熱點(diǎn)之一,受到了廣泛關(guān)注,這兩年在各大會(huì)議上都有相關(guān)文章發(fā)表,并且也有...

【導(dǎo)讀】無(wú)人機(jī)計(jì)算機(jī)視覺(jué)相關(guān)檢測(cè)和跟蹤( Vision Meets Drones)作為近年來(lái)的研究熱點(diǎn)之一,受到了廣泛關(guān)注,這兩年在各大會(huì)議上都有相關(guān)文章發(fā)表,并且也有一些競(jìng)賽。當(dāng)前, 無(wú)人機(jī)收集的視覺(jué)數(shù)據(jù)的自動(dòng)理解變得非常困難,并且其用途廣泛, 天津大學(xué)的朱鵬飛博士、京東數(shù)字科技文瓏銀博士和紐約州立大學(xué)奧爾巴尼分校的 獨(dú)大為博士等新出的這 篇論文對(duì)近幾年基于無(wú)人機(jī)視覺(jué)檢測(cè)和跟蹤方法和數(shù)據(jù)集進(jìn)行了全面綜述, 總結(jié)了當(dāng)前面臨的挑戰(zhàn),提出了未來(lái)的發(fā)展方向和改進(jìn)方向 。作者也 提供了一個(gè) 大規(guī)模的無(wú)人機(jī)捕獲數(shù)據(jù)集VisDrone ,其中包括四個(gè)track,即 (1)圖像目標(biāo)檢測(cè),(2)視頻目標(biāo)檢測(cè),(3)單目標(biāo)跟蹤,(4)多目標(biāo)跟蹤 。 對(duì)每一個(gè)track進(jìn)行了詳細(xì)得說(shuō)明,并強(qiáng)調(diào) VisDrone是迄今為止發(fā)布的最大的此類(lèi)數(shù)據(jù)集,可以在無(wú)人機(jī)平臺(tái)上對(duì)視覺(jué)分析算法進(jìn)行廣泛的評(píng)估和研究 。

https://github.com/VisDrone/VisDrone-Dataset

題目:Vision Meets Drones: Past, Present and Future

作者:Pengfei Zhu, Longyin Wen, Dawei Du, Xiao Bian, Qinghua Hu, Haibin Ling

【摘要】配備了攝像頭的無(wú)人機(jī),或稱(chēng)通用無(wú)人機(jī),已經(jīng)被快速部署到廣泛的應(yīng)用領(lǐng)域,包括農(nóng)業(yè)航空攝影、快速遞送和監(jiān)控。因此, 對(duì)無(wú)人機(jī)收集的視覺(jué)數(shù)據(jù)的自動(dòng)理解變得非常困難,這使得計(jì)算機(jī)視覺(jué)和無(wú)人機(jī)之間的聯(lián)系越來(lái)越緊密。為了促進(jìn)和跟蹤目標(biāo)檢測(cè)和跟蹤算法的發(fā)展,我們與 歐洲計(jì)算機(jī)視覺(jué)大會(huì)(ECCV) 2018和IEEE計(jì)算機(jī)視覺(jué)國(guó)際會(huì)議(ICCV) 2019聯(lián)合舉辦了兩個(gè)挑戰(zhàn)研討會(huì),吸引了全世界100多支團(tuán)隊(duì)。我們提供了一個(gè) 大規(guī)模的無(wú)人機(jī)捕獲數(shù)據(jù)集VisDrone,其中包括四個(gè)track,即 (1)圖像目標(biāo)檢測(cè),(2)視頻目標(biāo)檢測(cè),(3)單目標(biāo)跟蹤,(4)多目標(biāo)跟蹤。本文首先 對(duì)目標(biāo)檢測(cè)和跟蹤數(shù)據(jù)集和基準(zhǔn)進(jìn)行了全面的回顧,并討論了 收集具有完全手動(dòng)標(biāo)注的大規(guī)模基于無(wú)人機(jī)的目標(biāo)檢測(cè)和跟蹤數(shù)據(jù)集的挑戰(zhàn)。之后,我們 描述了VisDrone數(shù)據(jù)集,該數(shù)據(jù)集是從中國(guó)北方到南方的14個(gè)不同城市的各個(gè)城市/郊區(qū)捕獲的 。VisDrone是迄今為止發(fā)布的最大的此類(lèi)數(shù)據(jù)集,它可以在無(wú)人機(jī)平臺(tái)上對(duì)視覺(jué)分析算法進(jìn)行廣泛的評(píng)估和研究。我們?cè)敿?xì)分析了 無(wú)人機(jī)大尺度目標(biāo)檢測(cè)與跟蹤領(lǐng)域的現(xiàn)狀,總結(jié)了當(dāng)前面臨的挑戰(zhàn),提出了未來(lái)的發(fā)展方向和改進(jìn)方向。我們預(yù)計(jì)這一基準(zhǔn)將極大地促進(jìn)無(wú)人機(jī)平臺(tái)視頻分析的研發(fā)??梢詮囊韵戮W(wǎng)站下載所有數(shù)據(jù)集和實(shí)驗(yàn)結(jié)果: https://github.com/VisDrone/VisDrone-Dataset。

https://arxiv.org/abs/2001.06303v1

  • 后臺(tái)回復(fù)“ 無(wú)人機(jī)視覺(jué) ” 就可以 獲取最新 論文 的下 載鏈接~

引言

近年來(lái),計(jì)算機(jī)視覺(jué)因其在交通監(jiān)控、智慧城市、人機(jī)交互等領(lǐng)域的廣泛應(yīng)用而受到越來(lái)越多的關(guān)注。作為計(jì)算機(jī)視覺(jué)的兩個(gè)基本問(wèn)題,目標(biāo)檢測(cè)和跟蹤一直受到廣泛的關(guān)注。在導(dǎo)致計(jì)算機(jī)視覺(jué)技術(shù)快速發(fā)展的眾多因素和努力中,值得注意的貢獻(xiàn)應(yīng)歸功于眾多基準(zhǔn)和挑戰(zhàn)的發(fā)明或組織, 如目標(biāo)檢測(cè)的Caltech [1], KITTI [2], ImageNet [3], 和MS COCO [4],目標(biāo)跟蹤的OTB [5], VOT [6], MOTChallenge [7], UA-DETRAC [8], 和LaSOT [9]。

配備攝像頭的無(wú)人機(jī)已經(jīng)被快速部署到廣泛的領(lǐng)域,包括農(nóng)業(yè)、航空攝影、快速投遞和監(jiān)視。因此,對(duì)從這些無(wú)人機(jī)收集的視覺(jué)數(shù)據(jù)的自動(dòng)理解變得非常困難,這將計(jì)算機(jī)視覺(jué)越來(lái)越緊密地帶入了無(wú)人機(jī)。盡管一般的計(jì)算機(jī)視覺(jué)算法(如檢測(cè)和跟蹤)取得了很大的進(jìn)步,但這些算法通常不是處理無(wú)人機(jī)捕獲的序列或圖像的最佳算法。這是由于各種各樣的挑戰(zhàn),如較大的視點(diǎn)變化和規(guī)模。因此,為無(wú)人機(jī)捕獲的視覺(jué)數(shù)據(jù)開(kāi)發(fā)和評(píng)估新的視覺(jué)算法至關(guān)重要。然而,正如[10]和[11]所指出的,由于缺乏公開(kāi)的大規(guī)?;鶞?zhǔn)或數(shù)據(jù)集,對(duì)這一目標(biāo)的研究受到嚴(yán)重限制。最近,[10]、[11]和[12]致力于構(gòu)建無(wú)人機(jī)捕獲的數(shù)據(jù)集,這些數(shù)據(jù)集主要用于目標(biāo)檢測(cè)或跟蹤。由于數(shù)據(jù)收集和標(biāo)注方面的困難,這些數(shù)據(jù)集的大小和涉及的場(chǎng)景仍然有限。對(duì)現(xiàn)有或新開(kāi)發(fā)的算法進(jìn)行徹底的評(píng)估仍然是一個(gè)開(kāi)放的問(wèn)題。為了進(jìn)一步推進(jìn)無(wú)人機(jī)平臺(tái)視頻分析研究,需要一個(gè)更通用、更全面的基準(zhǔn)。

因此,作者與歐洲計(jì)算機(jī)視覺(jué)大會(huì)(ECCV) 2018和IEEE國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV) 2019聯(lián)合舉辦了兩次挑戰(zhàn)研討會(huì),吸引了全世界100多個(gè)研究團(tuán)隊(duì)。挑戰(zhàn)集中在目標(biāo)檢測(cè)和跟蹤的四個(gè)track。

  • -圖像目標(biāo)檢測(cè)跟蹤(DET)。

  • -視頻目標(biāo)檢測(cè)跟蹤(VID)。

  • -單目標(biāo)跟蹤(SOT)。

  • -多目標(biāo)跟蹤(MOT)。

  • 值得注意的是,在研討會(huì)挑戰(zhàn)中, 本文提供了一個(gè)大型數(shù)據(jù)集,包含179個(gè)視頻中263個(gè)視頻片段; 10個(gè)視頻中的264幀畫(huà)面; 209張靜態(tài)圖像。 數(shù)據(jù)由不同的無(wú)人機(jī)相機(jī)記錄,包括位置(取自中國(guó)14個(gè)不同的城市)、環(huán)境(城市和農(nóng)村地區(qū))、物體(如行人、車(chē)輛和自行車(chē))和密度(稀疏和擁擠的場(chǎng)景)。作者選擇了10類(lèi)在無(wú)人機(jī)應(yīng)用中最受關(guān)注的目標(biāo),比如行人和汽車(chē)。作者共仔細(xì)標(biāo)注了來(lái)自這些類(lèi)別的超過(guò)250萬(wàn)個(gè)目標(biāo)實(shí)例的邊界框。此外,還提供了一些重要的屬性,包括場(chǎng)景的可見(jiàn)性、目標(biāo)類(lèi)別和遮擋,以提高數(shù)據(jù)使用率。表1列出了所提供的無(wú)人機(jī)數(shù)據(jù)集與其他相關(guān)基準(zhǔn)數(shù)據(jù)集在目標(biāo)檢測(cè)和跟蹤方面的詳細(xì)比較。

    在這篇論文中, 作者重點(diǎn)關(guān)注了2018年和2019年的VisDrone挑戰(zhàn),以及挑戰(zhàn)的方法、結(jié)果和評(píng)估方案,希望這一挑戰(zhàn)能在很大程度上促進(jìn)相關(guān)領(lǐng)域的研究和發(fā)展。

    表1: 最先進(jìn)的基準(zhǔn)和數(shù)據(jù)集的比較。注意,分辨率表示基準(zhǔn)和數(shù)據(jù)集中包含的視頻/圖像的最大分辨率。(1 k = 1000)

    VISDRONE概述

    VisDrone基準(zhǔn)主要關(guān)注以下四個(gè)任務(wù)(見(jiàn)圖1),即(1)圖像目標(biāo)檢測(cè),(2)視頻目標(biāo)檢測(cè),(3)單目標(biāo)跟蹤,(4)多目標(biāo)跟蹤。作者構(gòu)建了一個(gè)網(wǎng)站: www.aiskyeye.com來(lái)訪問(wèn)VisDrone數(shù)據(jù)集,并對(duì)這四個(gè)任務(wù)進(jìn)行評(píng)估。值得注意的是,對(duì)于每個(gè)任務(wù),訓(xùn)練、驗(yàn)證和測(cè)試子集中的圖像/視頻都是在不同的位置捕獲的,但是共享相似的場(chǎng)景和屬性。訓(xùn)練子集用于訓(xùn)練算法,驗(yàn)證子集用于驗(yàn)證算法的性能,測(cè)試挑戰(zhàn)子集用于研討會(huì)競(jìng)賽,測(cè)試開(kāi)發(fā)子集用作公共評(píng)估的默認(rèn)測(cè)試集。參與者可以獲得用于訓(xùn)練和驗(yàn)證子集的手工標(biāo)注的ground truth,但是為了避免算法的(過(guò)度)擬合,測(cè)試子集的ground-truth被保留。

    圖1: 提出的數(shù)據(jù)集的一些帶注釋的示例圖像。虛線框表示目標(biāo)被遮擋。不同的邊框顏色指示目標(biāo)的不同類(lèi)別。為了更好地可視化,僅顯示一些屬性。

    圖2: 每幅圖像的目標(biāo)數(shù)量 vs. DET track中訓(xùn)練、驗(yàn)證、測(cè)試挑戰(zhàn)和測(cè)試開(kāi)發(fā)子集中圖像的百分比。

    在文章中,作者詳細(xì)描述了每個(gè)track的數(shù)據(jù)集的數(shù)據(jù)統(tǒng)計(jì)信息和標(biāo)注信息。

  • DET TRACK

  • 圖3: DET track中訓(xùn)練集、驗(yàn)證集、測(cè)試挑戰(zhàn)集和測(cè)試開(kāi)發(fā)集中不同對(duì)象類(lèi)別不同遮擋度的目標(biāo)數(shù)量。

    表2: 參加2018年和2019年VisDrone-DET挑戰(zhàn)賽的隊(duì)伍,按字母順序排列。

    表3: VisDrone-DET數(shù)據(jù)集上算法的比較結(jié)果。

    圖4: 圖像目標(biāo)檢測(cè)任務(wù)中具有挑戰(zhàn)性的問(wèn)題描述。

  • VID TRACK

  • VID TRACK的目的是在視頻序列中從一組預(yù)定義的類(lèi)別中定位目標(biāo)實(shí)例。也就是說(shuō),給定一系列視頻片段,需要算法以實(shí)值置信度為每個(gè)視頻幀(如果有)中的每個(gè)目標(biāo)實(shí)例生成一組邊界框。

    圖5: 在VID和MOT track的訓(xùn)練、驗(yàn)證、測(cè)試挑戰(zhàn)和測(cè)試開(kāi)發(fā)子集中,目標(biāo)軌跡的長(zhǎng)度與軌跡的百分比。

    圖6: 在VID和MOT track的訓(xùn)練、驗(yàn)證、測(cè)試挑戰(zhàn)和測(cè)試開(kāi)發(fā)子集中,不同類(lèi)別的目標(biāo)軌跡數(shù)量。

    表4: 參與2018年和2019年VisDrone-VID挑戰(zhàn)賽的隊(duì)伍,按字母順序排列。

    表5: VisDrone-VID數(shù)據(jù)集上算法的比較結(jié)果。

  • SOT TRACK

  • 對(duì)于SOT track,主要關(guān)注一般的單對(duì)象跟蹤,也稱(chēng)為無(wú)模型跟蹤[5],[91],[92]。特別是對(duì)于輸入視頻序列和第一幀中目標(biāo)對(duì)象的初始邊界框,SOT track要求算法在后續(xù)視頻幀中定位目標(biāo)邊界框。這些序列中的跟蹤目標(biāo)包括行人、汽車(chē)、公共汽車(chē)和動(dòng)物。

    表6: 參加2018年和2019年VisDrone-SOT挑戰(zhàn)賽的隊(duì)伍,按字母順序排列。

    圖8: (a)在2018年測(cè)試挑戰(zhàn)賽中,VisDrone-SOT 2018(以紅色標(biāo)記表示)和VisDrone-SOT 2019(以藍(lán)色標(biāo)記表示)挑戰(zhàn)中排名前10位的跟蹤器的success vs. precision 得分。VisDrone-SOT 2018和VisDrone-SOT 2019挑戰(zhàn)中的跟蹤器分別以紅色和藍(lán)色標(biāo)記表示。(b)在2019年測(cè)試挑戰(zhàn)賽中,VisDrone-SOT 209挑戰(zhàn)賽中排名前10位的跟蹤器的success vs. precision 得分。(c)測(cè)試開(kāi)發(fā)集上最先進(jìn)的跟蹤器的success vs. precision 得分。

  • MOT TRACK

  • MOT track旨在恢復(fù)視頻序列中目標(biāo)的軌跡,這是計(jì)算機(jī)視覺(jué)在許多應(yīng)用中的重要問(wèn)題,在監(jiān)控、運(yùn)動(dòng)分析和運(yùn)動(dòng)視頻分析等領(lǐng)域有著廣泛的應(yīng)用。在VisDrone-2018挑戰(zhàn)中,根據(jù)是否在單獨(dú)的幀中使用之前的檢測(cè)結(jié)果,將這個(gè)track劃分為兩個(gè)sub-track。具體來(lái)說(shuō),對(duì)于一個(gè)sub-track,需要提交一種算法來(lái)恢復(fù)視頻序列中目標(biāo)的軌跡,而不需要將目標(biāo)檢測(cè)結(jié)果作為輸入。

    表7: 參加VisDrone-MOT 2018和2019挑戰(zhàn)賽的隊(duì)伍,按字母順序排列。

    表8: 使用[77]中的評(píng)估協(xié)議對(duì)VisDrone-MOT數(shù)據(jù)集上算法的比較結(jié)果。

    表9: 使用CLEAR-MOT評(píng)估協(xié)議[43]對(duì)VisDrone-MOT數(shù)據(jù)集上算法的比較結(jié)果。

    結(jié) 論

    本文引入了一種新的大規(guī)模基準(zhǔn), VisDrone,以促進(jìn)無(wú)人機(jī)捕獲圖像的目標(biāo)檢測(cè)和跟蹤研究。 超過(guò)6000個(gè)工作小時(shí)收集、標(biāo)注和組織了大量目標(biāo)實(shí)例,來(lái)推動(dòng)目標(biāo)檢測(cè)和跟蹤算法的發(fā)展,數(shù)據(jù)集強(qiáng)調(diào)在真實(shí)生活環(huán)境中捕獲圖像和視頻片段。值得注意的是,該數(shù)據(jù)集記錄了中國(guó)14個(gè)不同城市的各種無(wú)人機(jī)平臺(tái),并呈現(xiàn)了多種現(xiàn)實(shí)場(chǎng)景。本文提供了一組豐富的標(biāo)注集,包括250多萬(wàn)個(gè)帶標(biāo)注的目標(biāo)實(shí)例以及一些重要屬性。VisDrone基準(zhǔn)通過(guò)項(xiàng)目網(wǎng)站www.aiskyeye.com提供給研究社區(qū)。在實(shí)際應(yīng)用中,在四個(gè)track的最佳submission仍然遠(yuǎn)遠(yuǎn)不能令人滿意。

網(wǎng)友評(píng)論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

推薦圖文

關(guān)注官方微信

手機(jī)掃碼看新聞