您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

別怪我往智能音箱的這片虛火上“潑冷水”!

2017-07-07 05:53 性質(zhì):轉(zhuǎn)載 作者:物聯(lián)網(wǎng)智庫 來源:物聯(lián)網(wǎng)智庫
免責(zé)聲明:中叉網(wǎng)(www.htyl001.com)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機構(gòu)所有。文章內(nèi)容觀點,與本網(wǎng)無關(guān)。如有需要刪除,敬請來電商榷!)
就像貝索斯自己都沒預(yù)見經(jīng)歷Fire Phone慘敗后的亞馬遜Echo竟會如此大獲成功,智能家居領(lǐng)域可能同樣也沒想過智能音箱這款并不新鮮的玩...

  就像貝索斯自己都沒預(yù)見經(jīng)歷Fire Phone慘敗后的亞馬遜Echo竟會如此大獲成功,智能家居領(lǐng)域可能同樣也沒想過智能音箱這款并不新鮮的玩意兒竟然會是那匹殺出重圍的黑馬。

  繼海外四大科技公司同時入局之后,智能音箱的這把邪火從海外一直燒到了海內(nèi),BAT三家也紛紛“下海”。

2014年11月,亞馬遜發(fā)布了智能音箱Amazon Echo,搭載語音服務(wù)助手Alexa
2016年5月,谷歌帶來Google Home智能家居設(shè)備,搭載語音助手Google Assistant
2016年底,微軟和哈曼卡頓合作推出智能音箱Invoke,基于Cortana語音助手
2017年6月,蘋果發(fā)布智能語音音箱HomePod,支持用戶通過Siri控制音箱

2017年1月,百度聯(lián)合小魚在家發(fā)布搭載了 DuerOS 的視頻對講機器人
2017年6月,騰訊聯(lián)合數(shù)字家圓發(fā)布搭載了小微的“親見 H2”,另表示其智能音箱產(chǎn)品“耳朵”將于8月前后發(fā)布
2017年7月(昨天),阿里推出搭載了 AliGenie 的智能語音終端設(shè)備“天貓精靈 X1”

  當(dāng)然,除了“四大天王”和BAT,還有京東聯(lián)合科大訊飛發(fā)布的“叮咚”,喜馬拉雅發(fā)布的“小雅”,聯(lián)想、酷狗等公司一家不落,一大智能家居初創(chuàng)企業(yè)亦蜂擁而至。隨著越來越多的團隊開始打造智能音箱,并將之作為智能家居“控制中樞”,人們貌似陷入了一個怪圈:想入局智能家居,就得做音箱。

  在鳥山明的畫筆下,集齊七顆龍珠就能召喚神龍,現(xiàn)在市場上智能音箱的龍珠可遠不止七顆,可智能家居的神龍又在哪里呢?

為何偏偏是智能音箱?

  對于最近大火的智能音箱,不少人可能會感到疑惑——偌大的智能硬件市場,為何偏偏是智能音箱獨得恩寵?

  有的人說音箱價格相對便宜,占地空間小,和電視等大物件相比,用音箱做智能家居控制中心比較容易入局;還有的人從需求來談,說聽歌娛樂已經(jīng)成為人們茶余飯后必須的休閑活動,而音箱的接受度及普及率相對較高。

  當(dāng)然,最關(guān)鍵的一點的還是交互方式的變革——從DOS到Windows,從命令代碼到圖形化操作是用戶體驗的一次飛躍;從按鍵到觸屏,向人類自然操作方式更近了一步;現(xiàn)在,語音正在成為一種更加順應(yīng)人性的自然交互方式。

  但說到這兒,問題還沒得以解答,畢竟很多設(shè)備都能搭載語音交互功能,為何偏偏是音箱呢?

  別怪筆者對音箱的偏見,既然要搶占智能家居的入口,搶占智能家居的控制中心,至少要選一件大多數(shù)人都離不開的家居吧,可是音箱卻實在算不上一個家庭的剛需設(shè)備。

  以前,音箱多是作為電視、電腦的配件存在的,但是隨著技術(shù)的提升,現(xiàn)在的電視已經(jīng)擁有了環(huán)繞立體聲響系統(tǒng),電腦也開始講究便捷和便攜,音箱也就漸漸成了“雞肋”;另外,隨著手機、平板電腦的出現(xiàn),在聽音樂上,人們有了更多的選擇,鑒于音箱的體積、音樂共放對周邊造成的困擾,人們更愿意插上耳機享受自己的音樂世界;況且,國內(nèi)多數(shù)人對于音質(zhì)是沒有太高要求的,因此音箱的存在也就可有可無,對于這些人而言,一部手機、平板電腦完全可以取代音箱。

  再直白些講,智能音箱的本質(zhì)就是一個音箱,而讓它能夠從眾多音箱中鶴立雞群的就是其中所加載的語音識別、云服務(wù)等人工智能技術(shù),以及與第三方服務(wù)商的無縫連接,而這些,只要廠商愿意,幾乎每個智能硬件都可以做的跟智能音箱一樣出色,甚至可以更好。如果以彩電作為中心,也可以執(zhí)行控制智能家電、訂餐、詢問天氣、叫外賣等指令,除了語音交互,它還兼具視覺交互呢!同樣,家庭智能網(wǎng)關(guān)也可以作為交互的中心,因為家里所有硬件的互聯(lián)都需要通過網(wǎng)關(guān)。

  “真火”還是“虛火”?

  鑒于音箱如此的不必要,以智能音箱作為智能家居入口可能本身就是一個偽命題。

  這時候可能就會有人出來拿數(shù)據(jù)打筆者的臉了,怎么就是虛火怎么就是偽命題了?你看人家亞馬遜的Echo!

  根據(jù)CIR的報告,自2014年11月發(fā)布到2017年1月,亞馬遜Echo系列(包括Echo、EchoDot和Tap)用戶已達到820萬,公司2017年的銷量目標(biāo)是1000萬臺。

  好吧,1000萬臺的銷量絕對不是一個小數(shù)字,可是用戶的實際使用頻率如何呢?據(jù)某研究機構(gòu)調(diào)查數(shù)據(jù)顯示,在美國,大約有3600萬用戶每月會用到一次語音操控的音箱,這就相當(dāng)慘淡了。

  而且,亞馬遜Echo的成功是因為它選對了音箱作為入口嗎,絕對不是的。Echo的大獲成功連亞馬遜自己都感到驚訝,這款革命性產(chǎn)品是由亞馬遜數(shù)百技術(shù)人員歷時三年才打磨完成,經(jīng)過了相當(dāng)長的時間積累。

  亞馬遜高管Dave Limp曾經(jīng)說過:我很難計算出為了開發(fā)這款產(chǎn)品,我們到底花費了多少人力和物力。

  比如說為了把虛擬語音助手Alexa對用戶需求做出的回復(fù)時延從原來的2.5s-3s降到更低,開發(fā)團隊做了數(shù)千次內(nèi)部測試,并且每周都要與科學(xué)家們合作進行數(shù)據(jù)分析。最終,團隊把延時控制在了1.5秒以內(nèi),而這一數(shù)字已經(jīng)遠遠領(lǐng)銜當(dāng)時的其他競爭對手。

  再比如說,為了讓Echo和它內(nèi)置的虛擬語音助手Alexa能夠在用戶提出需求后迅速做出擬人化的回答,研發(fā)小組提出了“綠野仙蹤”測試(the Wizard of Oz experiment)。具體的測試方法是:讓一名人類“魔法師”坐在一個房間里,對另一名實驗對象所向Echo發(fā)出的任何命令做出即時回應(yīng)。比如,如果實驗對象詢問Echo“今天紐約的天氣怎么樣?”時,另一個房間里的“魔法師”就要將回復(fù)迅速打出來,并通過Echo的語音將答案發(fā)送出去。實驗結(jié)束后,實驗對象需要填寫一份滿意度問卷,并寫出他們喜歡怎樣的回復(fù)。

  “這應(yīng)該能算做是某種心理學(xué)測試了,目的就在于發(fā)現(xiàn)人們到底會對何種回應(yīng)感到滿意。我們發(fā)狂般的專注于探尋不同回應(yīng)的滿意度,并進行了一系列持續(xù)的科學(xué)實驗。”
——某早期小組成員

  相比之下,國內(nèi)很多智能家居小廠商由于體量問題,往往接不到功能較為強大的軟硬件資源;也有某些廠商為了趕上這個風(fēng)口,在幾個月時間內(nèi),通過跟一些第三方語音方案和硬件公司的合作,迅速把產(chǎn)品從圖紙設(shè)計轉(zhuǎn)為實物上市,雖然看起來能用,但整個交互以及體驗欠佳,缺乏對使用場景的了解和對用戶行為和心理習(xí)慣的研究。

  另外,國內(nèi)和國外的“行情”也不盡相同,國內(nèi)80%以上音頻產(chǎn)品200塊以內(nèi),超過500塊月銷量超過1萬臺難度很大。而且中文口音、方言復(fù)雜,語音識別、語義理解難度都高于英文更大,要打磨出好的產(chǎn)品體驗,能”聽“會”說“還會”思考“,需要更長時間。

  如果僅僅是因為智能音箱“熱”就認(rèn)為它“對”,繼而盲目跟風(fēng),最后不過是為媒體再添一份死亡名單罷了。

智能音箱是虛,語音交互是真

  總之,智能音箱只是語音的載體之一,筆者相信,若是亞馬遜當(dāng)時用同樣的精力做了一款另外的產(chǎn)品,憑借相同的用戶體驗,也會成功。畢竟,Echo身為音箱,其它功能都挺好,唯有音質(zhì)卻實在不敢恭維。

  人與世界的交互,無非是通過用手摸、用眼睛看、用耳朵聽。如今,我們與數(shù)字產(chǎn)品的交互正處于用手摸(觸控技術(shù))和用眼睛看(屏幕)的階段,下一階段語音交互或?qū)⒊蔀橹髁鳌?/P>

  目前的智能家居多是通過APP進行操控,需要打開手機再打開APP這樣多余的過程,其實是為用戶增加了困撓,根本就是“”偽智能,《鋼鐵俠》里托尼•史塔克只需喚一聲“給我一杯咖啡”,智能系統(tǒng)就會自動制作一杯美味的咖啡送到面前,這樣智能、便捷的家居生活,才是一直以來人們追求的夢想。

  互聯(lián)網(wǎng)女皇”瑪麗·米克爾在《2017年度互聯(lián)網(wǎng)趨勢報告》中同樣指出,語音是最有效的計算輸入形式,將成為人機交互的新范式。相比打字,語音交互的優(yōu)勢明顯:人每分鐘平均可以說150個單詞,打字只能打40個。同時語音交互既簡單又方便,一個麥克風(fēng)即可解決,尤其適合物聯(lián)網(wǎng)的場景。語音即計算界面,其應(yīng)用的三大場景是家里、車?yán)?、隨手,更快更方便就是用戶價值所在。

  總之,語音交互可以以各種設(shè)備作為載體,如果還有新來的企業(yè)想入局智能家居,暫且放過可憐音箱吧!

 

 

 

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機掃碼看新聞