5 月 24 日,DJI 發(fā)布了“曉”Spark 無人機(點擊藍字了解詳情),它顛覆了此前人們對于 DJI 無人機的認知,巴掌大的 Spark 蘊藏著巨大能量,創(chuàng)造了 DJI 無人機中許多個第一。掌上起落、手勢控制、一鍵短片等功能讓人眼前一亮。如此有“魔力”的 Spark 是如何誕生的?DJI 研發(fā)團隊帶你揭秘 Spark 幕后的設(shè)計歷程。
DJI - “曉” Spark - 捕捉精彩瞬間
歷經(jīng)一年多時間,我們從最簡單的構(gòu)思開始——要做出一款具備獨特交互體驗的小型智能航拍無人機,使無人機更貼近生活。于是開始在 DJI 集思廣益慢慢讓方案成型,逐步把我們這些年積累起來的一些技術(shù)解密出來,從游擊隊到正規(guī)軍,從 demo 到量產(chǎn)。如今產(chǎn)品發(fā)布,回想那些很有意思的產(chǎn)品打磨歷程,在此與大家分享。
從 0 到 1 對于腦洞大開的我們而言困難并不大,但如何在有限時間內(nèi)在無數(shù)個可能性之間做出正確選擇、在技術(shù)與藝術(shù)面前找到最恰到好處的答案、在錯綜復(fù)雜的技術(shù)架構(gòu)中重構(gòu)一個極簡的工程、推進實現(xiàn)簡單易用的用戶體驗、從 1 臺到 10 萬臺...這才極富挑戰(zhàn),也是最令我們興奮無比的部分。
她是我們所有人的親生寶貝,剛剛呱呱墜地,呈現(xiàn)在你們面前。她叫“曉”Spark,簡單純粹。
小而簡單,不簡單
“曉”有多小?只有巴掌大小,是名副其實的一臺“掌機”?!奥槿鸽m小,五臟俱全”,我們第一次把這么多精密傳感器,壓縮在如此令人驚嘆的體積,同時,重量也只有 300 克。
DJI 不同系列無人機
即使小,也不忘保留兩軸機械增穩(wěn)云臺與高精度鏡頭,使拍攝畫面平穩(wěn)出眾。
即使小,卻也具備兩組相機、3D 傳感系統(tǒng)、紅外測高模塊、GPS / GLONASS 雙模衛(wèi)星定位系統(tǒng)、高精度慣性測量單元以及 24 核高性能計算單元,使其穩(wěn)定、安全、聰明。
即使小,也只有結(jié)合避障功能,具備了以 GPS 飛控系統(tǒng)為基礎(chǔ)的自主飛行能力,才能具備電子圍欄技術(shù),才能在合法飛行區(qū)域中享受飛行與航拍的樂趣,才能確保最最基本的安全穩(wěn)定。這是我們設(shè)計產(chǎn)品之初,便堅定不移認為的必須要素。可以說,是否具備這項要素,是在斑馬線上睜著眼睛走路與閉著眼睛走路的區(qū)別。
因此她不是一個玩具,而是具備感知、懂得思考的一個活著的智能生物。
創(chuàng)造 Spark,最大的挑戰(zhàn)在于把這么多東西塞到那么小的空間里,要同時兼顧成本、可生產(chǎn)性、可靠性、散熱、減震、動力效率、電磁干擾、射頻性能,那么系統(tǒng)功能更是一件難上加難的事。
為了在結(jié)構(gòu)把云臺和飛控的減震支架合并,我們做了無處次實驗。為了減少不同環(huán)境對指南針的干擾,許多其他模塊為此做了專門的軟件優(yōu)化。Spark 的“手臂”很小,要把各種根筋(電調(diào)連接線)和身體(主控)連接起來,我們得改變傳統(tǒng)的辦法,把五根筋做成了三根并確保其性能,為此付出了很大的努力。
FlightAutonomy 中的視覺定位系統(tǒng),就是基于這些基礎(chǔ)來感知立體信息,計算位置和速度的。過程中我們挑戰(zhàn)過 Spark 在各種高低不平場景的穩(wěn)定性(如樓梯),和她貼地高速飛行、高空飛行等性能,調(diào)優(yōu)后能夠讓 Spark 在復(fù)雜環(huán)境下仍能保持精準懸停與實時感知障礙物。
這些不同模塊之間各司其職,彼此緊密協(xié)調(diào)溝通,聚合成一個完美的獨立個體。在狹小空間中穿越飛行,就猶如空中一條平穩(wěn)的滑軌。不僅如此穩(wěn)定,在確保其性能的前提下,Spark 還能達到機動性的釋放,在運動檔下竟可達到 50 公里/小時。靜如處子,動如脫兔!
本能的,極簡手勢控制交互
從口袋拿出 Spark,電源啟動后,在 10 秒內(nèi)即可完成人臉掃描并從你掌上起飛*,你使用手掌控制飛行器移動,她完成自動跟隨、拍照等一系列動作后返回到你的掌心。我們內(nèi)部稱之“脫控一條龍”,因為通過手勢控制,你無需依賴任何控制設(shè)備!
*使用該功能時,建議搭配槳葉保護罩
那么,這個計算機視覺交互的里程碑是如何實現(xiàn)的呢?
首先我們都是星戰(zhàn)迷,感受到原力這種古老而神奇的力量,猶如一種命運感召,不遺余力要完成這項偉大的絕地復(fù)興使命。(呵呵,開玩笑)
事實上我們從用戶場景出發(fā),認為交互一定首先得是人類本能的,一種自然而然的操控方式。我們期待用戶不需要理解任何“遙控器通道”、“桿量”、“飛行姿態(tài)”、“橫滾俯仰油門”這些晦澀難懂的概念,只需簡單地認知——手勢是一種人與人之間最原始交流的方式。在人機交互當中,你能夠與 Spark 進行直接溝通。你做出一個手勢,她“曉得了”即點頭并做出回應(yīng),有來有往,彼此形成一種默契。
因而我們研究了大量的手語,也參考了機場停機坪操作手如何表達復(fù)雜的組合性指令,設(shè)計了很多套控制手勢,想辦法與飛行器的傳感器結(jié)合起來。
簡單而言,除了主要用以航拍的攝像頭,Spark 的額頭還有一個小型深度相機(TOF),不斷采集三維空間里的手勢視覺信息。采集到的這些手勢圖像傳輸給飛行器CPU進行運算分析,完成后給飛行器發(fā)送特定的指令。在現(xiàn)有手勢識別算法無法滿足傳感器要求的情況下,我們的工程師為了確保飛行器能對近距離的用戶手勢進行快速、準確地響應(yīng),從最底層開始重寫所有模塊,算法上做了大量的優(yōu)化,讓 Spark 真正成為了你手臂的延伸。
AR 指點飛行,所見即可達
這一次,我們把去一個地方這回事,做到了極簡。這是為 Spark 全新設(shè)計的 AR 指點功能,你只需要在手機屏幕上輕輕一點,一個目標即刻生成在世界坐標當中,飛行器隨即沿著此目標安全抵達!
很多年以來,學(xué)會飛行一直是很麻煩的事情,你極容易在多通道按鍵的傳統(tǒng)遙控器面前不知所措。即使采用虛擬搖桿的方式在手機上操控飛行器,也只是照搬物理遙控器,需要左右手精細配合才能控制好。尤其是支持室內(nèi)飛行的小型機,稍有不慎緊張操作即刻失控碰壁。
當前無人駕駛話題熱火朝天,因為技術(shù)的發(fā)展允許大家敢于向傳統(tǒng)發(fā)問,我們要開車去一個地方為什么還要學(xué)會各種操作、學(xué)會剎車、學(xué)會方向盤?在不遠的未來,我們不再需要學(xué)習(xí)復(fù)雜的駕駛。
我們決定勇敢先邁出無人機行業(yè)的這一步,用觸摸屏上最簡單的交互方式——[點擊],并輔助增強現(xiàn)實的辦法來解決“去一個地方”的命題。
交互很簡單,但一定要確保在室內(nèi)的狹小空間也能安全抵達目的地,我們干脆就直接挑戰(zhàn)研發(fā)辦公室里貫穿南北的狹長通道,從最初的磕磕碰碰,通過不斷調(diào)試,最終使其在窄距空間也能自如穿行。為此我們前臺的保安大哥在深夜的時候經(jīng)常會被呼嘯而過的 Spark 驚嚇到。
目的地會顯示一個 AR 圓盤貼附在地面上,這是通過計算云臺的角度、相機 FOV 角以及當前飛行器的高度進行空間假設(shè)而顯示出來的,是我們迄今為止最為直觀的一種目的地顯示辦法,做到了真正的“所見即所達”。
更令人驚嘆的是,我們的工程師甚至做到了當你點擊的目標點前方有障礙物,Spark 會提前尋找空間自動繞行過去!這得益于 Spark 強大的整機性能基礎(chǔ)與深度相機達到精準視覺定位,讓她在立體空間里能不斷感知周圍事物并進行自主導(dǎo)航。
一鍵短片,即刻分享
“到手即飛”是我們很長時間以來的一個研發(fā)思路,也是許多消費級航拍機的產(chǎn)品定位。但這一次我們嘗試了更進一步,往“到手即出片”的方向突破,做到了把確定拍攝對象、進行拍攝、調(diào)色剪輯并分享的過程,簡化到“一鍵即可出片”。
在這個閉環(huán)里,只需輕輕一點,Spark 立即以你為中心拍出一個高質(zhì)量的 10 秒航拍視頻。
如何做到呢?
我們先研究了大量用戶使用飛行器進行自拍的視頻,分析其背后推動此分享行為的深層原因,得出以下三個結(jié)論:
1. 我是誰(要有特寫)
2. 我在哪(要有遠景)
3. 我很酷(要有音樂)
要滿足這三點,我們的工程師為此升級了“智能跟隨”的技術(shù)方案。飛行器會根據(jù)鎖定的目標,自動執(zhí)行特定飛行軌跡并錄制一段視頻。有了基本思路,就可以通過最優(yōu)秀的電影鏡頭語言,把 Spark 的空中滑軌潛能給釋放出來,最終最終確定了“沖天”、“漸遠”、“環(huán)繞”、“螺旋”四種拍攝軌跡。
不只是讓人物處于畫面中央,我們還特意考慮了地平線與人物構(gòu)圖的關(guān)系,使得鏡頭遠離的時候還能出現(xiàn) 1/3 的黃金分割地平線。而在“螺旋”動作模式中,為了達到一個優(yōu)美的拍攝曲線,也參考了斐波納切數(shù)列。
想達到一個最佳的 10 秒短片,我們在 DJI GO 4 中把視頻的中間部分進行抽幀壓縮,讓這片子能達到從特寫到遠景的最佳過渡。同時邀請了國內(nèi)外幾個新銳的作曲為我們這個功能創(chuàng)作了大量 10 秒原創(chuàng)音樂。
從場景上考慮,你在執(zhí)行動作模式的過程當中,若需要釋放雙手進行歡呼,相信雙指上滑的全屏鎖屏功能可以帶給你驚喜。這時手機揣褲兜里不必擔心誤觸,飛行器完成模式拍攝后將會自動返回到你面前,就像一個回旋鏢。
這就是誠意滿滿的“一鍵短片”功能,融合了我們研發(fā)對用戶需求的挖掘、理解與技術(shù)積累,讓原來需要復(fù)雜操作才能完成的動作,變得無比簡單。
生于大疆,意義非凡
我們很長時間都只是為 Spark 保持一個特定的研發(fā)代號,直到接近發(fā)布的時刻才知道她的名字,這一刻仿佛賦予了其靈魂。對于我們來說,也賦予了我們存在與努力的意義。
我們和深圳這個城市一樣年輕、大膽,勇于突破自己。研發(fā)的工程師們都來自不同地方,有很多主力甚至是剛畢業(yè)的應(yīng)屆生,彼此純粹、重視溝通,大家在模塊的成本、重量、功耗中找到平衡點,反復(fù)迭代設(shè)計以得到最好的系統(tǒng)性能。
研發(fā)樓層里有一個空曠的室內(nèi)飛場,因為不停地有很多飛行器盤旋在半空進行調(diào)試,聲音很大。因此這里常常有激烈的辯論,彼此表達觀點,俗稱“當面撕逼”。我們一旦確定了解決辦法,肯定、干脆,大家即刻會快速執(zhí)行出來并迅速迭代。
在產(chǎn)品Proposal階段,我們項目組就要求相關(guān)模塊的同事一起協(xié)同完成,集思廣益、人人參與。隨著產(chǎn)品開發(fā)過程的深入,會指定相應(yīng)系統(tǒng)應(yīng)用級的功能代表來以最終用戶體驗的角度來驅(qū)動功能迭代開發(fā)。大家一起緊密協(xié)調(diào),簡化應(yīng)用場景,精簡功能邏輯。
回想這一切,都讓我們感到Spark的面世,濃縮了我們的理想、才智、堅持不懈的努力與對極致產(chǎn)品的追求,意義非凡。
致力于用技術(shù)與創(chuàng)新力為世界帶來全新視角,公司以“未來無所不能”為主旨理念,在無人機系統(tǒng)、手持影像系統(tǒng)與機器人教育領(lǐng)域成為業(yè)內(nèi)領(lǐng)先的品牌,以一流的技術(shù)產(chǎn)品重新定義了“中國制造”的創(chuàng)新內(nèi)涵。
十二年間,通過不斷革新技術(shù)和產(chǎn)品,公司開啟了全球“天地一體”影像新時代;在影視、農(nóng)業(yè)、地產(chǎn)、新聞、消防、救援、能源、遙感測繪、野生動物保護等多個領(lǐng)域,重塑了人們的生產(chǎn)和生活方式。
從創(chuàng)立至今,公司一直堅守“激極盡志,求真品誠”的企業(yè)精神。始終踐行全新的文化和價值觀,將卓爾不群的產(chǎn)品之道貫穿到每一個細節(jié),展現(xiàn)科技的無限可能。
DJI就是個敢于說真話的孩子。這里由一群從不妥協(xié)、極富洞見、堅持夢想的人聚合而成。我們堅信實干而非投機,堅信夢想而非功利。我們堅決踐行全新的文化價值觀和思維方法論,從創(chuàng)始之初至今從未改變。
DJI是一個創(chuàng)新的烏托邦,我們搭建了一個尊重夢想的舞臺,構(gòu)建了純粹的企業(yè)環(huán)境,努力探索卓爾不群的產(chǎn)品之道和企業(yè)文化。沒有一家公司像DJI一樣,將求真品誠的理念貫穿到每一個細節(jié),對此我們引以為傲。
十年間,DJI站在了行業(yè)之巔,開啟全球飛行影像新時代,展現(xiàn)出改造世界的無限可能。我們的經(jīng)歷證明,一個初出茅廬的年輕人不去曲意逢迎、不去投機取巧,只要踏實做事,就一定能取得成功。我們相信,那些回歸常識、尊重奮斗的人,終將洞見時代機遇,并最終改變世界。
大道無疆,創(chuàng)新無限。如果你志存高遠、懷揣夢想,決心踏實做事、創(chuàng)造價值,卻在扭曲的現(xiàn)實中自我懷疑、彷徨無奈,那就加入DJI吧! 在這里,與更多真知灼見者碰撞,與更多志同道合者同行!
未來,無所不能!
2025-09-17 10:54
2025-09-17 10:53
2025-09-17 10:53
2025-09-17 10:25
2025-09-16 09:32
2025-09-16 09:31
2025-09-16 09:27
2025-09-16 09:25
2025-09-16 09:24
2025-09-16 09:23