您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

機器視覺離消費市場有多遠(yuǎn)?

2016-04-25 07:10 性質(zhì):轉(zhuǎn)載 作者:金紅 來源:雷鋒網(wǎng)
免責(zé)聲明:中叉網(wǎng)(htyl001.com)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機構(gòu)所有。文章內(nèi)容觀點,與本網(wǎng)無關(guān)。如有需要刪除,敬請來電商榷?。?/div>
作為人工智能的兩個分支,計算機視覺與機器視覺在近年都取得了長足的進(jìn)步。前者自2010年以來,隨著深度學(xué)習(xí)再度流行并用于目標(biāo)識別,...

  作為人工智能的兩個分支,計算機視覺與機器視覺在近年都取得了長足的進(jìn)步。前者自2010年以來,隨著深度學(xué)習(xí)再度流行并用于目標(biāo)識別,在人臉識別等方面已經(jīng)超過了人類;而后者在工業(yè)應(yīng)用方面,也有不少突破性的應(yīng)用。

  但是,在消費級市場方面,計算機視覺與機器視覺的進(jìn)展并不大。不少人對于計算機視覺與機器視覺在消費級市場能有多大實質(zhì)性地應(yīng)用,存在深深地?fù)?dān)憂。

  計算機視覺與機器視覺

  首先,我們有必要理清楚機器視覺與計算機視覺之間的關(guān)系。從學(xué)科分類上,二者都被認(rèn)為是ArtificialIntelligence下屬科目,不過計算機視覺偏軟件,通過算法對圖像進(jìn)行識別分析,而機器視覺軟硬件都包括(采集設(shè)備,光源,鏡頭,控制,機構(gòu),算法等),指的是系統(tǒng),更偏實際應(yīng)用。簡單的說,我們可以認(rèn)為計算機視覺是研究“讓機器怎么看”的科學(xué),而機器視覺是研究“看了之后怎么用”的科學(xué)。

  機器視覺離消費市場有多遠(yuǎn)?

  計算機視覺與機器視覺的問題是,前者太學(xué)術(shù),后者太工業(yè),因而一直以來在消費級市場缺乏好的產(chǎn)品。圖漾創(chuàng)始人費浙平向雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號關(guān)注)記者說,機器視覺的很多核心技術(shù)和原理多年前就比較成熟了,近年來的進(jìn)展主要集中在工程化,比如GPU和視覺計算加速器的出現(xiàn)解決了計算量問題。但與此同時,要想把視覺技術(shù)實現(xiàn)真正產(chǎn)品落地,中間還有不少其他問題,他們也在摸索中。

  視覺技術(shù)在消費級市場最早的嘗試是微軟的Kinect。2010年,微軟聯(lián)合深度攝像頭技術(shù)方案提供方PrimeSense正式對外推出Kinect,利用骨骼捕捉技術(shù),Kinect可以捕捉游戲玩家的骨骼動作,從而讓游戲玩家可以不接觸屏幕即可玩游戲。在Kinect之后,華碩、Intel、谷歌以及蘋果也相繼在深度攝像頭的應(yīng)用場景上跟進(jìn),一切都看起來往好的方向發(fā)展。

  但深度攝像頭作為獨立產(chǎn)品,市場化難度頗大。例如Intel在13年在開發(fā)者會議上宣布,將推出自己的微型深度感知模塊,華碩、戴爾、惠普、聯(lián)想等多家PC廠家都將從2014年下半年開始在產(chǎn)品線中部署這款深度感知模塊。而兩年多過去了,曾經(jīng)預(yù)言的集成深度攝像頭的產(chǎn)品遲遲未見。

  那么,處于計算機視覺和機器視覺交叉部分的深度攝像頭,應(yīng)該如何打開消費級市場?

  深度攝像的瓶頸

  深度攝像頭也稱RGBD攝像頭。我們常用的攝像頭是RGB攝像頭,單一個攝像頭便能感知彩色可見光信息(Red、Green、Blue),而RGBD攝像頭是在我們常見的RGB攝像頭基礎(chǔ)上,增加了深度信息。

  深度攝像頭獲取圖像方式分為主動式獲取和被動式獲取。二者的主要區(qū)別集中在觀測傳感器是否主動向環(huán)境發(fā)出探測光。如大疆精靈4上的雙目視覺便是被動式獲取深度圖像,其技術(shù)特點是攝像頭不主動向環(huán)境中發(fā)射能量,而通過兩個以上攝像頭計算特征點的坐標(biāo)差得出感知環(huán)境中現(xiàn)有能力得到信息,這一方式與人類雙眼獲得時差的方式最為相近,但最大的弊端在于限于目前的技術(shù),目前的識別精度還不高,過于依賴光線,而且無法處理特征不明顯的場景,所以強光暗光都會導(dǎo)致深度計算的失效。

  主動式獲取所采用的方式則是從蝙蝠等生物上尋找靈感,通過主動發(fā)射探測光通過計算獲取深度圖像。這當(dāng)中又分為三類:“RF-modulatedlightsourceswithphasedetector”、“Rangegatedimagers”、“DirectTime-of-Flightimagers”,如Kinect一代所采用的PrimeSense就屬于第二類,隨著蘋果收購PrimeSense,微軟也在Kinect二代中改為微軟自有技術(shù),一般認(rèn)為二代采用的是直接TOF的技術(shù)。

  以Kinect的深度攝像頭為例,它包含了一個紅外投射器、一個RGB攝影頭和一個紅外感應(yīng)器,由于深度攝像頭自帶光源,而且是不可見的紅外光,對我們的生活無任何影響。似乎深度攝像頭獲取景深信息就已經(jīng)完美了,但也有他的弊端。由于是主動方式,兩個同波段紅外光會出現(xiàn)干涉,導(dǎo)致兩臺一樣的深度攝像頭沒有辦法一起使用,而且受發(fā)射功率的影響,檢測距離也會受到很大影響。

  市面上常見的深度攝像頭,Kinect距離最遠(yuǎn),但也需要最高達(dá)到12W的用電供給,拖一根供電線很是累贅。同時,深度攝像頭還難以應(yīng)用于戶外,因為陽光中也有紅外成分,會對主動紅外光部分造成干擾。紅外光對于玻璃情景,也無計可施,出現(xiàn)無法探測距離的情況。

Kinect獲取的深度圖像

  艱難中的嘗試

  Kinect一代售罄一空之后,對Kinect二代的綁定更加嚴(yán)厲,這更加抑制了銷售量;LeapMotion兩年前由于銷售情況不如預(yù)期,不得不解雇了10%的員工,切入虛擬現(xiàn)實;蘋果收購了Primesense之后也不知道在盤算什么小九九,有分析稱蘋果打算放在iPhone上,這樣我們拍照時就能拍出3D效果的了;另一邊Intel則將目標(biāo)對準(zhǔn)了機器人無人機,比如小米的機器人SegwayRobot以及昊翔的無人機TyphooonH。機器人和無人機正是這兩年的大熱產(chǎn)品,看起來Intel可能會成為贏家,但因為SegwayRobot和TyphooonH都還未正式上市,因此效果如何還有待驗證。也就是說,在消費級市場還沒有一個特別成功的案例。

IntelCEO科再奇展示應(yīng)用了RealSense模塊的的TyphooonH

  而在國內(nèi),Intel的RealSense出來之后,給了國內(nèi)一些創(chuàng)業(yè)者的信心,因此催生了一批相關(guān)的創(chuàng)業(yè)企業(yè),但目前成規(guī)模的應(yīng)用也寥寥無幾。

上一頁12

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機掃碼看新聞