您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

圖靈機器人俞志晨:語義識別即將進入圈場景大戰(zhàn)

2018-03-31 07:28 性質:轉載 作者:網(wǎng)易科技報道 來源:網(wǎng)易科技報道
免責聲明:中叉網(wǎng)(htyl001.com)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
在2018中國(深圳)IT領袖峰會期間,網(wǎng)易科技對圖靈機器人創(chuàng)始人兼CEO俞志晨進行了專訪。俞志晨透露,2018年語義識別領域最核心的就是...

  在2018中國(深圳)IT領袖峰會期間,網(wǎng)易科技對圖靈機器人創(chuàng)始人兼CEO俞志晨進行了專訪。俞志晨透露,2018年語義識別領域最核心的就是圈場景,這也是圖靈機器人目前最核心的目標。此前圖靈機器人主要產(chǎn)品在兒童機器人市場,2018年下半年,圖靈機器人將進入更多場景。(溫泉)
以下為訪談全文,略經(jīng)編輯:
  網(wǎng)易科技:之前提到人工智能,提語音和圖像識別比較多,為什么語義識別不像前兩者那么廣為人知?
  俞志晨:圖像識別,它會更前端一些,語音很多時候是會偏后端一些,后端一些支撐的技術,包括一些后端的應用,這兩個其實是有些差別的。而且它的整個的技術的發(fā)展的節(jié)奏也不太一樣,比如說語音,包括應用語音的整個市場發(fā)展,從時間上來看,第一語音整個的模式和它的商業(yè)化這塊,其實是走得最前的,視覺主要是去年,去年的市場處于爆發(fā)期。然后語義,語義實際上還是屬于第三波的產(chǎn)業(yè)機會。
  單從大的未來來看,語義毫無疑問它的市場覆蓋面肯定會比語音和視覺要大。
  網(wǎng)易科技:這是為什么?
  俞志晨:你看語音的發(fā)展契機像科大訊飛,還有包括國內出來一些語音公司,基本上都屬于大概,最早第一波2000年初就開始起來了,2000年左右科大訊飛就屬于發(fā)展的比較好的,上市,包括國外也是這樣的。之前整個人工智能行業(yè),早期就是以語音為主。去年、前年視覺開始爆發(fā)。
  這一方面是說本身這個技術在不斷成熟,另一方面是說,有安防的這個場景來托它,這么一個大的市場機會,就導致整個視覺這塊的市場在催化。語義現(xiàn)在還處于一個沉淀、積累的階段。我認為語義的能量還遠遠沒有爆發(fā)出來,這是從目前整個市場的形態(tài)來看是這樣的。
  網(wǎng)易科技:為什么它還處于沉淀和積累的階段,它為什么發(fā)展的程度沒有語音和視覺那么成熟?它要解決哪幾個關鍵問題才算比較成熟,它目前已經(jīng)解決了哪幾個問題,有哪幾個問題沒有解決?
  俞志晨:剛才為什么說像語義將來的市場空間會更大?我認為語義現(xiàn)在技術通常有兩個階段。一方面是說很多時候它會提升效率,給to B的企業(yè)來用,這個是目前不管是語音、視覺、語義都會經(jīng)歷這個階段,這個過程是必不可少的。當然我認為再往后走,整個語義整個是能夠,比如客服也好,其實它的基本技術全部是圍繞語義來做的。
  客服是一大塊,它實際上像很多的智能音箱,語音識別是一部分。但是為什么一開始大家很關注語音,因為語音它是一個很容易感受到的東西,你里面所有的功能都是基于語義來做出來的東西。
  但是對用戶來講,他可能以為它是基于語音做出來的。但是實際上像智能音箱那個產(chǎn)品,90%的東西是在語義。但是你可能感覺這就是語音識別,就跟SIRI是一樣的,因為人對這種,有一個詞叫定義,定義上語音的這個詞更容易帶人們腦中里面產(chǎn)生一個更加直觀的印象。語義這個詞太過技術化,一般大部分的消費者其實不太容易理解語義這個詞的。你看絕大部分語音交互的產(chǎn)品,大部分是在語義這塊。
  網(wǎng)易科技:所以您剛剛是解釋它將來的市場空間更大,是因為大部分的語音交互的產(chǎn)品,語音交互的產(chǎn)品90%的工作是在語義這塊,而不是語音這塊?
  俞志晨:這是必然的,從可辨性來看,語音和視覺的可辨性其實是固定的,它的價值就很明確,就是我要把語音信號轉成文字。但是它的前期的落地性會比較容易一些,因為它目的明確,所以它的普及度更快一些。視覺也一樣,視覺這塊也是說通過人臉識別、物體識別去做一些視覺的事情,它的場景相對來講比語音復雜一些,但是也是相對來講比較明確的,就是它作為市場是比較明確的,就是是別人,識別物體。但是語義的合并性就多了,我用語義怎么來跟這些場景結合。相當于這種場景的結合性和延伸性,會比單純一個語音識別的模塊要大很多的。
  就像是說我做手機的,其實毫無疑問,你說做手機公司整個市場價值規(guī)模更大,還是說基于移動互聯(lián)網(wǎng)整個這一套里面的App市場價值更大?
  網(wǎng)易科技:我覺得有一個比喻可能更能翻譯您的這個意思,是不是就是有一千個讀者,就有一千個哈姆雷特,你一段文字在那,有一千個人理解的是不同的意思,他反饋出來的行為也是完全不同的,是這個意思吧?
  俞志晨:你也可以這么來去理解,因為語義實際上真的是一個,它其實目前來講是一個偏技術化的概念。它不像語音這么通俗,但是語音其實就是說我剛舉的例子,你看現(xiàn)在智能音箱這個硬件,硬件其實沒多少錢,一百多塊錢,但是里面的那些應用和那些服務技能,全部是基于語義來做的。所以語義能夠延伸的價值會比,其實音箱,一個硬件或者一個語音識別的模塊,其實要大很多的。但是很多時候它倆是不同的階段,不同的模塊。
  網(wǎng)易科技:您為什么覺得它還處于積累和沉淀期?
  俞志晨:因為語義不好實現(xiàn),就像你剛才說的,一千個讀者有一千個哈姆雷特,這個事情從技術層面來講很難實現(xiàn)它。不像語音識別,剛才說語音是一個,比如我說一個字,它是一對一的關系,視覺也是一對一的關系,就是傳感,感知系統(tǒng)是一對一的關系。但是語義是一對X,不知道多少個關系。所以這個事情本身從技術上來說很難,因為它很難,所以它結合起來的話,可能需要的工作量會大很多。
  網(wǎng)易科技:語義識別現(xiàn)在發(fā)展到什么程度了,哪些問題是可以現(xiàn)在完全能解決掉的,哪些問題是沒有被解決掉的?
  俞志晨:語義通常有幾個方面,從大的來看,第一個是說指令型的這種理解,比如說很多音箱,智能家居,說打開或者關閉,我們叫指令級的理解,這個是屬于最低的層次,但是這個也是目前解決的比較好的。第二是問答系統(tǒng)。比如說很多客服,它實際上還是多輪,就是屬于帶有一定的復雜任務的,這個其實會更高階一些,用在客服,用在一些其他的虛擬的一些助手這些領域。這個領域其實門檻又會更高了一些。第三個層次是在開放域的聊天系統(tǒng),就跟人一樣,我們閑聊,天馬行空的在聊。這個從技術實現(xiàn)來說應該是最難的,這也是整個行業(yè)的難點,從技術上來講,可能技術上還做不到這種突破吧。
  網(wǎng)易科技:目前能夠達到的這個和用戶需求的當中,這個距離還有多遠,還有哪些問題沒有解決?
  俞志晨:我的感覺,第一是說它的整個問題單子里面有很多個,有一堆問題需要解決。第一個是說,這種語境的理解,上下文這塊的理解。比如我說我餓了,你說我真的餓了嗎,其實不是。那它怎么判別是不是餓了還是不餓,還是說他到底說這句話是什么意思。
  網(wǎng)易科技:它需要的信號不光是這個語言這個項,它需要很多環(huán)境的信號。
  俞志晨:其實單純從文字的信息抽出來的話,它永遠不能夠百分之百能夠去理解這句話的真實意圖。但是它需要去融合一些背景信息,融合一些這種環(huán)境信息,包括時間,你的一些習慣,還有包括你的一些性格,然后判定你是不是真的餓了,以及你真正的意圖。語義是一個意圖理解和識別的過程。
  網(wǎng)易科技:你剛剛指的這個對語境的理解是其中的問題之一,還有很多問題沒有被解決。
  俞志晨:對,語境是一塊,第二是說整個知識圖譜體系。理論上講,如果我們想要做通用的東西,前提是我需要去構建一個龐大的體系化的知識圖譜,而且它還得具備推理功能,這個其實還是挺難的一件事情。第三個是語言的表達層面,說實話現(xiàn)在目前機器人的語言表達的豐富性還是不夠的,語言的表達這塊,怎么讓它像個人一樣的去表達這些語言。它能做到一定的表達的能力,比如說像如果打分的話,100分是滿分,它可能能做到50分、60分,但是離我們所謂的比較好的效果還有一定的差距。
  最后還有一個歸于它的性價比,我們做的事情,很多時候技術跟它整個的它商業(yè)化的場景,它倆是相輔相成的。如果說這個技術投入過大,那可能這個事情就很難推。但是如果這個技術推起來還能賺到錢,這個事情就比較容易推。像語音識別一樣,它已經(jīng)能賺到一點點錢了,圖像也一樣,圖像識別是它確認已經(jīng)能夠開始去掙錢了,而且能夠商業(yè)化的還不錯。
  網(wǎng)易科技:你們之后還會如何來推動語義的應用?
  俞志晨:我們跟百度的VR這塊有合作。用VR結合圖靈AI做了一個虛擬機器人,也就是VR版的一個機器人,就相當于Siri加一個人工形象,然后用在VR世界里面去做交互。
  網(wǎng)易科技:那我明白了。我之前在很多場合聽過圖靈機器人,但是我不知道現(xiàn)在你們的產(chǎn)品是用在哪些領域,我們生活當中,哪些產(chǎn)品背后其實是用你們的技術?
  俞志晨:很多音箱,很多機器人可以跟你對話,可以跟你互動,但背后的技術你肯定不知道是誰家的。我們原來最早一大塊是在微信里面,比如微信公眾賬號,微信群還包括有QQ。從過去一兩年也更多是向很多兒童機器人、兒童玩具這類的產(chǎn)品用我們的語義技術。
  網(wǎng)易科技:你們在微信公眾賬號里面的應用是什么?
  俞志晨:類似很多的一些公眾賬號,比如你可以給它發(fā)文字、發(fā)語音,然后它給你回答,它就是一個類似一個自動的個性化的群管理機器人。
  網(wǎng)易科技:圖靈機器人目前主要的競爭優(yōu)勢是什么?
  俞志晨:第一就是語義技術,第二就是產(chǎn)品體驗。
  網(wǎng)易科技:你們目前在語義這塊是國內第一嗎?
  俞志晨:我只能說我們至少在語義這個行業(yè)里面數(shù)一數(shù)二,因為第一這個事情是沒法兒去驗證的,你說我們比微軟的好,這個事情好像也沒有辦法去實際證明。但是至少說從客戶,從整個的各種指標來看,我們還是這個領域的,算是領先的公司吧。第二是說在一些特定場景,那肯定以我們最好,比如像兒童語義,那我們肯定是最好的。比如同樣做語音和對話,微軟小冰可能會用在二次元,或者是一些偏90后、95后這個群體比較多一些,我們的年齡段更小一點,我們可能是在05后,10后,就是偏兒童這塊更多一些。
  網(wǎng)易科技:我們現(xiàn)在在市場上能見到的那種兒童陪伴的機器人,背后絕大部分都是用的你們的語義識別技術?
  俞志晨:差不多。
  網(wǎng)易科技:任何一個牌子嗎?現(xiàn)在我在機場看到好多商店里面不是好多那種陪伴機器人。
  俞志晨:我看了一下,應該有一半了吧。
  網(wǎng)易科技:另外一半用的是誰的?
  俞志晨:有訊飛,也有用百度的,也偶爾會用其他的一些第三方的語義公司的,零零散散的。我去機場看,一半多。因為機場擺的東西不太一樣,我只能說一半、一半多。
  網(wǎng)易科技:2018年語義這塊,您覺得會有什么樣的一個進展,市場整體上發(fā)展到一個什么狀況?
  俞志晨:從市場來看,今年各家公司對于語義的關注力度會更大,很簡單因為語義其實格局還是比較確認,而像科大訊飛和百度,這幾家語音的市場份額是比較固定的,想搶也不太容易搶,視覺的那幾家也基本上占得比較緊。
  第二是說關于這個技術本身的走勢來看,在今年或者明年會有更多的一些好的產(chǎn)品能落地,這是必然的趨勢。
  第三今年最重要的一個事情就是各家來圈場景,誰能夠真正把場景拿下來,這是很重要的事情。因為我覺得像對于語義來講,它跟場景有很大關聯(lián)性,它目前還不像語音和圖像那樣做得那么通用,但是語義實際上跟場景的依賴性還是比較強。
  網(wǎng)易科技:圖靈機器人目前,你們今年主要做哪些事,今年主要的核心也是圈場景嗎?
  俞志晨:圍繞著兒童場景來進行,兒童AI是關鍵。
  網(wǎng)易科技:圖靈不是已經(jīng)兒童機器人這個場景不是已經(jīng)圈住了嗎,你們還準備圈什么場景?
  俞志晨:兒童有核心場景,也還有更大的場景,比如穿戴、學習,還有包括線下,比如商超。
  網(wǎng)易科技:你們主要會圍繞兒童的市場來做嗎,還是說今年你們也會做別的?
  俞志晨:今年第一肯定是兒童,我們會首先把它做好。別的領域我們也會做,但是現(xiàn)在我估計今年下半年我們會有一些其他領域的產(chǎn)品,會有一些發(fā)布,到時候可以關注一下。
  網(wǎng)易科技:目前在語義這塊是不是大部分是集中在兒童這個市場上的?
  俞志晨:也不是,你像客服就很多,還有做輿情,其實挺多的,做輿情分析、客服,還有做一些語音助手,包括智能家電、音箱、車載,其實都有涉及。
  網(wǎng)易科技:為什么你們沒有選擇那些場景,而是選擇了兒童這個場景呢?
  俞志晨:我們覺得對于公司來講,可能這個場景相對來講更容易成熟一些,比較容易去把這個市場真的能夠做得比較成熟。
  網(wǎng)易科技:其他的比如客服好像我也聽到,也挺多的。
  俞志晨:但是客服這個事情比較分散,這個市場也很大,但是這個市場很分散,很難一家把它占到一個很大的市場份額,就這個意思。所以這個就跟公司的選擇有關系,我們可能不太去選擇做那些定制化程度比較高的領域。
  網(wǎng)易科技:你們先做通用性比較高的?
  俞志晨:對,垂直場景在我們看來是說,它的場景的通用性還是比較強的,我們會去做。
  網(wǎng)易科技:除了兒童機器人這個市場,你們還覺得有哪幾個市場也是比較不錯的,符合你剛才說的比較通用的,能夠大范圍真正落地的?
  俞志晨:VR、AR這種當然也可以,但是這個市場可能還需要再培育一下。說實話我別的關注的倒不是很多,我現(xiàn)在最主要就是關注兒童還有機器人領域這兩塊。別的車載其實也還行,車載這個市場足夠大,但是車載這個時間會長一點。智能家居也不錯,但是智能家居短期之內想掙到錢,可能不會那么容易。
  網(wǎng)易科技:為啥不會那么容易?
  俞志晨:我說對AI技術來講,因為整個市場處于變革期,像音箱這個領域現(xiàn)在量很大,吸引大家的眼球,但是音箱想掙到多少錢,其實有點難。

  網(wǎng)易科技:為啥?
  俞志晨:因為他們在燒錢,補貼。
  網(wǎng)易科技:他們賣的價格比較低?
  俞志晨:對,因為它從源頭開始就不掙錢,他們就補貼。補貼完了之后其實你,如果它整個前端不掙錢的話,后端這塊也很難真正的能收到錢,這個沒有那么快。
  網(wǎng)易科技:你們會進入哪些新的領域?
  俞志晨:我們還是圍繞服務機器人的方向去走。
  網(wǎng)易科技:但是就不光是兒童了?
  俞志晨:別的可能會涉及一下,但是現(xiàn)在,可能到下半年我們會明朗一些,現(xiàn)在還在做一些驗證。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

  • 本周工業(yè)車輛行業(yè)熱點回顧(2023.2.5-2.11)
    每次拿起論語來與孩子們一起閱讀,總會有所收獲。子曰:“君子不器?!本硬黄鳎覀兂3Uf的一個成語而已,就是不能只成為某一個專業(yè)的人才,如是為政的人,就...

    2023-02-13 12:20

  • 國家標準《叉車禁用與報廢技術規(guī)范》(初稿)討論會成功召開
    2023年2月9日,全國工業(yè)車輛標準化技術委員會(以下簡稱“工業(yè)車輛標委會”)組織召開了國家標準《叉車禁用與報廢技術規(guī)范》(初稿)討論會,會議以視頻形式召開...

    2023-02-11 09:16

  • LogisticsIQ:到2027年,全球AGV和AMR市場安裝量將超過240萬臺,規(guī)模達110億美元
    2023年2月6日電 根據(jù)咨詢公司LogisticsIQ最新的市場研究報告,移動機器人(AGV和AMR)市場預計到2027年將達到180億美元(近1300億RMB)以上,AGV和AMR的增長率分別約為24%和43%。AGV和AMR的總裝機...

    2023-02-08 09:40

  • 什么是機器視覺?
    機器視覺(Machine Vision)是機器處理和分析視覺信息的能力。雖然機器視覺最常用于制造業(yè),但許多行業(yè)都可以從更智能的機器中獲益。機器視覺機器視覺,有時也稱為計算機視覺,是計算機系統(tǒng)分析和...

    2023-02-08 09:38

  • 七大即將到來的機器視覺應用——由人工智能、相機和芯片的最新進展
    什么是機器視覺?機器視覺(Machine Vision,簡稱MV )是不同技術和方法的結合,可自動提取圖像信息,為機器在工業(yè)和非工業(yè)環(huán)境中執(zhí)行給定任務提供操作指導/關鍵數(shù)據(jù)。高投資回報率的持續(xù)報告除其...

    2023-02-08 09:35

  • ??低曂瞥鲞\動檢測 2.0,是一款具有人工智能的軟件
    新的??低曑浖貏e推薦用于各類中小型企業(yè)和住宅建筑的周界檢測。它使運動檢測技術更進一步,因為配備 Acusense 技術的新軟件能夠從真實通知中識別出由大雨、落葉或動物經(jīng)過等因素引起的誤報...

    2023-02-08 09:31

  • 建設智能倉庫不再需要大量投資
    隨著倉庫效率以及其他流程的簡化成為零售商和物流供應商的更大優(yōu)先事項,智能倉儲解決方案的采用正在迅速增長。倉庫自動化并不是什么新鮮事,但一些因素使其在整個供應鏈中的應用升級。例如,在過...

    2023-02-07 09:52

  • 如何選擇工業(yè)機器人?具有不同類型機器人的特點和主要應用的實用指南
    自1959年Devol和Engelberger開發(fā)的第一個模型--當時重達兩噸多的解決方案,具有開拓性,但與最近的版本相比,速度慢、笨重且不準確--工業(yè)機器人已經(jīng)經(jīng)歷了顯著的發(fā)展,其領域也在迅速發(fā)展。技術發(fā)...

    2023-02-07 09:48

  • 韓國造船業(yè)轉向機器人以克服工人短缺問題
    《韓國時報》據(jù)行業(yè)官員稱,周二,國內造船業(yè)正在引進機器人,以應對工人的短缺并防止安全事故。大宇造船和海洋工程公司(DSME)開發(fā)了一種碳素鋼管焊接機器人,它說可以改善工作環(huán)境和生產(chǎn)力,并...

    2023-02-07 09:44

  • 波士頓動力為DHL開發(fā)的新機器人每小時可以卸下 350 個箱子
    盡管有叉車、傳送帶和自動分揀系統(tǒng),世界各地的許多倉庫如果沒有一個人在裝貨區(qū)把箱子從卡車后面拉出來就無法運作。手工裝卸箱子,雖然聽起來很陳舊,但在從食品雜貨到服裝,再到大多數(shù)消費品的退...

    2023-02-06 09:47

關注官方微信

手機掃碼看新聞