您的位置:首頁 > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

科普:什么是機(jī)器視覺?

2022-12-09 09:45 性質(zhì):原創(chuàng) 作者:Hu yangbo 來源:AGV網(wǎng)
免責(zé)聲明:中叉網(wǎng)(www.htyl001.com)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要?jiǎng)h除,敬請來電商榷?。?/div>
機(jī)器視覺幫助機(jī)器人看到并識別周圍環(huán)境,以便它們可以執(zhí)行更復(fù)雜的任務(wù)。就在過去的幾年里,機(jī)器視覺的進(jìn)步幫助許多機(jī)器人和自動(dòng)駕駛汽車達(dá)到了幾乎類似人類的感知水平。使用無數(shù)的光學(xué)傳感器,如...

機(jī)器視覺幫助機(jī)器人看到并識別周圍環(huán)境,以便它們可以執(zhí)行更復(fù)雜的任務(wù)。

就在過去的幾年里,機(jī)器視覺的進(jìn)步幫助許多機(jī)器人和自動(dòng)駕駛汽車達(dá)到了幾乎類似人類的感知水平。使用無數(shù)的光學(xué)傳感器,如高分辨率的攝像頭,這些機(jī)器人和汽車,以它們自己的方式,終于能夠看到。

什么是機(jī)器視覺?機(jī)器視覺是一種允許基于計(jì)算機(jī)的硬件和機(jī)器(如機(jī)器人和自動(dòng)駕駛汽車)使用相機(jī)和其他光學(xué)傳感器感知其環(huán)境的技術(shù)。

什么是機(jī)器視覺?

機(jī)器視覺是使機(jī)器人和其他機(jī)器(如自動(dòng)駕駛車輛)能夠看到和識別周圍環(huán)境中的物體的技術(shù)。通過將光學(xué)傳感器與能夠分析和處理圖像數(shù)據(jù)的人工智能和機(jī)器學(xué)習(xí)工具配對,配備機(jī)器視覺系統(tǒng)的機(jī)器人和自主車輛能夠執(zhí)行更復(fù)雜的任務(wù),如在倉庫中拉動(dòng)訂單或在市區(qū)交通中導(dǎo)航。

隨著相機(jī)價(jià)格的下降,計(jì)算能力的提高和算法的成熟,機(jī)器視覺已經(jīng)幫助機(jī)器人技術(shù)擺脫了Rapid Robotics公司技術(shù)副總裁Tom Hummel所說的靜態(tài)編程狀態(tài)。Hummel說,由于深度學(xué)習(xí)的最新進(jìn)展,使機(jī)器人能夠?qū)嶋H分析它們所看到的東西,機(jī)器人能夠完成曾經(jīng)看起來不可能或成本太高的任務(wù),比如從垃圾箱中挑選特定的物品。

機(jī)器視覺是如何工作的?

大多數(shù)機(jī)器視覺系統(tǒng)需要一個(gè)光源,要么直接安裝在機(jī)器人上,要么設(shè)置在機(jī)器人運(yùn)行的設(shè)施內(nèi),這樣,所使用的攝像機(jī)(或照相機(jī))可以清楚地捕捉到周圍的物體、人類、潛在的危險(xiǎn)和其他特征。

一旦機(jī)器人捕捉到圖像,這些視覺數(shù)據(jù)就會(huì)被發(fā)送到處理器或機(jī)載計(jì)算機(jī),該計(jì)算機(jī)使用人工智能和機(jī)器學(xué)習(xí)算法對圖像進(jìn)行分析,通常還包括從其他傳感方式(如LiDAR、雷達(dá)和麥克風(fēng))收集的數(shù)據(jù)。

在對圖像和其他數(shù)據(jù)進(jìn)行處理后,這些信息被傳回給機(jī)器人或與它一起工作的其他機(jī)器。在那里,機(jī)器可以做出適當(dāng)?shù)臎Q定,無論是在人行橫道上停車,還是為訂單挑選合適的物品,從而提高效率和安全性。

機(jī)器視覺的類型

機(jī)器視覺主要分為三種類型:

維視覺:一維視覺不會(huì)一次分析整個(gè)物體的圖像,而是一次讀取一行,通常使用線掃描相機(jī)。這種類型的機(jī)器視覺通常用于檢測過程,以發(fā)現(xiàn)在傳送帶上移動(dòng)的產(chǎn)品中的缺陷。

二維視覺:二維視覺使用數(shù)碼相機(jī)收集圖像數(shù)據(jù),然后通過比較一幅圖像與另一幅圖像的對比度變化來處理這些數(shù)據(jù)。這種類型的機(jī)器視覺通常用于跟蹤物體,以及驗(yàn)證和檢查。

三維視覺:3D 視覺使用位于不同位置的多個(gè)數(shù)碼相機(jī)和其他傳感器來捕捉物體的數(shù)字模型,從而提供對其位置、大小和特征的準(zhǔn)確評估。這種類型的機(jī)器視覺通常用于幫助機(jī)器人在周圍環(huán)境中導(dǎo)航以及執(zhí)行與訂單履行相關(guān)的任務(wù),例如從箱子和容器中挑選產(chǎn)品。

機(jī)器視覺應(yīng)用

由于大多數(shù)人嚴(yán)重依賴視覺來工作和與世界互動(dòng),因此由于機(jī)器視覺,機(jī)器人也能做同樣的事情。機(jī)器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標(biāo)準(zhǔn)。自動(dòng)駕駛出租車使用視覺系統(tǒng)幫助在行人過馬路之前讀取他們的細(xì)微提示,而人類司機(jī)似乎在這方面做得越來越差。在倉庫中,自主移動(dòng)機(jī)器人使用機(jī)器視覺來幫助完成訂單。

機(jī)器視覺應(yīng)用

●用于裝配線以檢查零件以改進(jìn)質(zhì)量控制。

●幫助在倉庫中工作的機(jī)器人定位產(chǎn)品并在周圍環(huán)境中導(dǎo)航。

●允許自動(dòng)駕駛汽車感知周圍的世界并識別潛在的危險(xiǎn)。

制造業(yè)使用機(jī)器視覺進(jìn)行質(zhì)量控制

當(dāng)人們檢查從裝配線上下來的零件時(shí),他們通常不會(huì)仔細(xì)檢查每個(gè)零件以尋找缺陷。Hummel 說,這將花費(fèi)太多時(shí)間、太多金錢,并且需要人類無法做到的專注程度。

但是配備機(jī)器視覺系統(tǒng)的機(jī)器人手臂,如 Rapid Robotics 的 Rapid Machine Operator,可以檢查每一個(gè)。Hummel 說:“相機(jī)不睡覺。相機(jī)不在乎。而且相機(jī)速度很快。所以你可以檢查從注塑機(jī)出來的每個(gè)零件,或者從任何過程中出來的,然后決定丟棄它?!?/p>

因此,Hummel 表示,工廠不太可能運(yùn)出不良零件,操作員也能更好地了解他們生產(chǎn)的產(chǎn)品的質(zhì)量。

機(jī)器視覺幫助自動(dòng)駕駛出租車了解周圍環(huán)境

就在行人過馬路之前,他們通常甚至在腳踏入人行橫道之前就暗示他們要做什么。他們可能會(huì)從手機(jī)上抬起頭來,或者向左看,或者稍微舉起雙手。這些信號雖然微妙,但可以被自動(dòng)駕駛汽車觀察到或感知到。

亞馬遜旗下機(jī)器人出租車公司Zoox的感知總監(jiān) RJ He 說:“當(dāng)你考慮行人、司機(jī)和車輛之間的互動(dòng)時(shí),這些線索非常重要。識別這些線索是機(jī)器視覺的優(yōu)勢之一,也是該技術(shù)的亮點(diǎn)。當(dāng)你對如何使用各個(gè)傳感模式以及它們?nèi)绾蜗嗷パa(bǔ)充進(jìn)行深思熟慮時(shí),奇跡就會(huì)發(fā)生?!?/p>

Zoox 的電動(dòng)自動(dòng)駕駛汽車使用人工智能和機(jī)器學(xué)習(xí)算法以及攝像頭和其他傳感方式,例如測量和收集位置、速度和其他重要道路數(shù)據(jù)的 LiDAR、雷達(dá)和熱像儀,能夠看到周圍的世界并與之互動(dòng).這些汽車正在舊金山灣區(qū)、拉斯維加斯和西雅圖進(jìn)行測試,甚至可以預(yù)測附近的汽車、卡車、騎自行車的人和行人可能會(huì)或可能不會(huì)做什么,就像一個(gè)人踏入道路一樣。

他說:“當(dāng)你非常仔細(xì)地考慮如何使用單獨(dú)的傳感模式以及它們?nèi)绾蜗嗷パa(bǔ)充時(shí),魔法就會(huì)發(fā)生。無論是在視野和覆蓋范圍等方面,但更重要的是,在算法方面?!?/p>

通過利用機(jī)器視覺的個(gè)人優(yōu)勢和所有這些不同的傳感器模式和算法,Zoox 能夠創(chuàng)建他們的汽車可以實(shí)時(shí)響應(yīng)的世界的準(zhǔn)確表示,而不會(huì)傷害他們的乘客或其他人和周圍的生物或給他們帶來不便他們。

美國這樣的國家,近年來道路變得更加危險(xiǎn),這變得非常重要,這也是 Zoox 所做事情背后的動(dòng)機(jī)之一。

“對于人類司機(jī)在分心等等 ,我們需要確保我們能夠?qū)λ羞@些不良行為做出反應(yīng)?!彼f。

機(jī)器視覺幫助機(jī)器人完成訂單

雖然許多從事物流行業(yè)的機(jī)器人公司都依賴 LiDAR (激光雷達(dá))來幫助他們的機(jī)器人在倉庫中導(dǎo)航和完成訂單,但專門從事倉庫自動(dòng)化的機(jī)器人公司inVia Robotics卻依賴機(jī)器視覺。

據(jù) inVia 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Lior Elazary 稱,該公司的機(jī)器人使用機(jī)器視覺在倉庫內(nèi)操作,通過掃描 AprilTags為電子商務(wù)訂單提取產(chǎn)品,Elazary 將其描述為貼在容器上的二維碼。機(jī)器人分析它捕獲的代碼,這使它能夠理解它在看什么。

機(jī)器視覺系統(tǒng)也在倉庫內(nèi)進(jìn)行訓(xùn)練,在那里它收集并捕獲周圍的特征,這些特征使用算法進(jìn)行分析,從而從本質(zhì)上形成 Elazary 所說的機(jī)器人在倉庫內(nèi)以及容器或箱子中所處位置的“假設(shè)”它需要從中拉出來。它使用視覺伺服控制機(jī)器人的運(yùn)動(dòng),并允許它像人類一樣抓取物體。

Elazary 說:“最終,我們會(huì)用眼睛去抓住東西——你看到它在哪里,然后你就會(huì)磨練。這就是我們的機(jī)器人所做的?!?/p>

從本質(zhì)上講,機(jī)器視覺讓機(jī)器人能夠適應(yīng),而不是讓彎曲的架子或放錯(cuò)地方的盒子等小東西絆倒它——人類的小問題通常會(huì)給依賴激光雷達(dá)的機(jī)器人帶來問題,并可能導(dǎo)致更大的開支,比如更換貨架倉庫。

Elazary 說:“他指的是機(jī)器視覺系統(tǒng),這要難得多,但它的成本效益要高得多?!?/p>

機(jī)器視覺與計(jì)算機(jī)視覺

雖然機(jī)器視覺和計(jì)算機(jī)視覺這兩個(gè)術(shù)語經(jīng)常互換使用,但主要區(qū)別在于:

機(jī)器視覺系統(tǒng)需要相機(jī)來捕捉和提供圖像數(shù)據(jù),而計(jì)算機(jī)視覺系統(tǒng)可以從其他來源(比如互聯(lián)網(wǎng))獲取圖像。

計(jì)算機(jī)視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能和機(jī)器學(xué)習(xí)算法所在的地方。

從本質(zhì)上講,機(jī)器視覺是眼睛,而計(jì)算機(jī)視覺是大腦。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞