自主車輛和機(jī)器人領(lǐng)域通常采用激光雷達(dá)作為主要的系統(tǒng)導(dǎo)航傳感器。但相機(jī)和基于視覺的感知將越來越多地成為移動(dòng)機(jī)器人的技術(shù)基礎(chǔ)。
大多數(shù)自動(dòng)駕駛汽車制造商將高端3D激光雷達(dá)(LiDAR)以及其他傳感器納入他們的車輛,以便為他們提供足夠的數(shù)據(jù),充分了解他們的周圍環(huán)境并安全運(yùn)行。然而,在2019年4月,埃隆-馬斯克在特斯拉的自動(dòng)駕駛?cè)丈细嬖V與會(huì)者,LiDAR是一個(gè) "傻瓜的差事"--任何依賴它的人都是 "注定的",指的是特斯拉對(duì)基于視覺的感知的偏愛。
LiDAR/視覺的辯論一直持續(xù)到今天。但從那時(shí)起,自動(dòng)駕駛汽車市場(chǎng)對(duì)攝像頭和計(jì)算機(jī)視覺的重視程度在穩(wěn)步提高。
基于視覺的AMR導(dǎo)航
最近,在移動(dòng)機(jī)器人市場(chǎng)上也出現(xiàn)了同樣的爭(zhēng)論,幾十年來,傳統(tǒng)的二維激光雷達(dá)一直是主流的導(dǎo)航傳感器。一些AMR制造商,包括Canvas Technology(被亞馬遜收購),Gideon Brothers和Seegrid,已經(jīng)開發(fā)了具有不同程度的基于視覺的導(dǎo)航的AMR。
這些AMR公司選擇基于攝像頭的導(dǎo)航解決方案的原因之一是,與LiDAR相比,視覺系統(tǒng)的成本較低。但最令人信服的原因是基于視覺的系統(tǒng)能夠?qū)崿F(xiàn)全三維定位和感知。
尋求替代方案
三維激光雷達(dá)也是希望在其系統(tǒng)中增加三維感知能力的機(jī)器人開發(fā)商的一個(gè)選擇。但是,雖然3D LiDAR解決方案的價(jià)格在過去幾年中有所下降,但3D感知的總系統(tǒng)成本仍然是成千上萬美元。
對(duì)于機(jī)器人領(lǐng)域來說,汽車級(jí)3D LiDAR的成本通常很高。因此,機(jī)器人制造商繼續(xù)尋求成本較低的3D LiDAR替代品來實(shí)現(xiàn)3D感知。
攝像機(jī)可以看到天花板、地板上的自然特征,以及設(shè)施另一側(cè)的遠(yuǎn)處。
基于攝像頭的視覺系統(tǒng)
基于相機(jī)的視覺系統(tǒng)本質(zhì)上可以應(yīng)對(duì)感知的挑戰(zhàn),因?yàn)樗鼈兛梢?"看到 "其視野內(nèi)的一切并將其數(shù)字化。 利用其他行業(yè)的規(guī)模經(jīng)濟(jì),即使成本低于20美元的相機(jī)也能提供足夠的分辨率和視野,以支持強(qiáng)大的定位、障礙物檢測(cè)和更高水平的感知。
在具有挑戰(zhàn)性的環(huán)境中進(jìn)行定位
基于視覺的導(dǎo)航的另一個(gè)重要優(yōu)勢(shì)是能夠處理LiDAR失去穩(wěn)健性的挑戰(zhàn)性環(huán)境。典型的例子是物流倉庫,那里的一排排機(jī)架和貨架系統(tǒng)在整個(gè)設(shè)施中重復(fù)出現(xiàn)。
攝像機(jī)還可以看到天花板、地板上的自然特征,以及設(shè)施另一側(cè)的遠(yuǎn)處。但是LiDAR所能看到的世界的二維 "切片 "根本不足以區(qū)分這些環(huán)境中不同的、重復(fù)的特征。因此,基于LiDAR的機(jī)器人在許多情況下會(huì)感到困惑,甚至完全迷失。
這些挑戰(zhàn)也適用于開放或高度動(dòng)態(tài)的環(huán)境,如交叉碼頭和開放的倉儲(chǔ)設(shè)施。LiDAR在上次訪問時(shí)看到并解釋的 "切片 "現(xiàn)在可能是開放空間--或者完全是其他東西。
最終,為了實(shí)現(xiàn)真正的智能自主行為,導(dǎo)航系統(tǒng)必須提供人類水平的三維感知。
三維感知和場(chǎng)景理解
最后,也是最重要的,基于視覺的感知可以實(shí)現(xiàn)其他類型的傳感器根本無法實(shí)現(xiàn)的功能。最終,為了實(shí)現(xiàn)真正的智能自主行為,導(dǎo)航系統(tǒng)必須提供人類水平的三維感知。例如,由于攝像機(jī)可以檢測(cè)到紋理和顏色,因此能夠區(qū)分人行道的邊緣和道路的邊緣。這可以為送貨機(jī)器人創(chuàng)造顯著的安全優(yōu)勢(shì),因?yàn)闄C(jī)器人可以利用這一視覺信息精確地沿著其邊緣導(dǎo)航,就像人類一樣。
這種能力在倉庫和生產(chǎn)設(shè)施中非常有用,因?yàn)槟抢锏男腥说缆肥怯镁€條和地板標(biāo)記來定義的。 基于攝像頭的系統(tǒng)甚至可以讀取標(biāo)志和符號(hào),提醒人類和機(jī)器人注意臨時(shí)關(guān)閉、潮濕的地板和繞道。 基于視覺的導(dǎo)航系統(tǒng)還能夠在室內(nèi)和室外環(huán)境中工作--開辟了新的用例和應(yīng)用。
挑戰(zhàn)
在低成本的硬件上將來自相機(jī)的大量數(shù)據(jù)轉(zhuǎn)換為3D感知是一個(gè)巨大的技術(shù)和工程挑戰(zhàn)。這個(gè)過程需要工程師具備大量的人工智能、計(jì)算機(jī)視覺和傳感器融合方面的專業(yè)知識(shí),同時(shí)還需要有配套的技術(shù)。
值得慶幸的是,基于攝像頭的3D感知的強(qiáng)大的、可執(zhí)行的解決方案現(xiàn)在已被機(jī)器人工程師所接受。例如,RGo機(jī)器人公司的解決方案--感知引擎,是一個(gè)全棧式的軟件解決方案,使制造商能夠迅速提供下一代的能力。在一些應(yīng)用中,它能夠只利用一個(gè)攝像頭來實(shí)現(xiàn)精確的三維定位和感知。它的寬視場(chǎng)相機(jī)還能夠識(shí)別人類和周圍的其他障礙物。這種水平的場(chǎng)景理解使移動(dòng)機(jī)器人在人類周圍的行為更加自然和協(xié)作。
其他模式
綜上所述,包括LiDAR在內(nèi)的傳統(tǒng)傳感器模式仍然具有重要價(jià)值。最近在低成本MEMS三維激光雷達(dá)方面取得的進(jìn)展令人鼓舞,當(dāng)與相機(jī)結(jié)合時(shí),可以為機(jī)器人系統(tǒng)增加具有成本效益的穩(wěn)健性和豐富的三維制圖能力。
但馬斯克說的沒錯(cuò),相機(jī)和計(jì)算機(jī)視覺應(yīng)該作為任何移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)的基礎(chǔ)。未來幾年肯定會(huì)看到動(dòng)態(tài)變化,因?yàn)殡S著自主車輛和機(jī)器人行業(yè)的進(jìn)步,最先進(jìn)的技術(shù)也在不斷發(fā)展。
關(guān)于作者
Peter Secor作為市場(chǎng)營(yíng)銷和業(yè)務(wù)發(fā)展高級(jí)副總裁,負(fù)責(zé)建立RGo機(jī)器人公司的品牌,并為公司尋找新的客戶和市場(chǎng)機(jī)會(huì)。 在加入RGo之前,他曾在物聯(lián)網(wǎng)、工業(yè)自動(dòng)化、機(jī)器人和3D打印的前沿和交叉領(lǐng)域的公司擔(dān)任變革性職務(wù),包括iRobot和Stratasys。 Secor的職業(yè)生涯開始于管理顧問,他專門為工業(yè)自動(dòng)化市場(chǎng)的財(cái)富500強(qiáng)公司提供企業(yè)戰(zhàn)略發(fā)展和并購,包括羅克韋爾自動(dòng)化、西門子和霍尼韋爾。 他擁有新罕布什爾大學(xué)的機(jī)械工程學(xué)士學(xué)位和哥倫比亞大學(xué)哥倫比亞商學(xué)院的MBA學(xué)位,主修技術(shù)增長(zhǎng)營(yíng)銷。
2024-10-18 10:00
2024-10-18 09:59
2024-10-18 09:57
2024-10-18 09:56
2024-10-18 09:54
2024-10-18 09:54
2024-10-18 09:53
2024-10-17 11:48
2024-10-17 10:09
2024-10-17 09:06