您的位置:首頁 > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

在算法中練習(xí)百年后,機(jī)器人的手能比你更靈活嗎?

2018-08-08 07:50 性質(zhì):轉(zhuǎn)載 作者:36氪 來源:36氪
免責(zé)聲明:中叉網(wǎng)(htyl001.com)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來電商榷?。?/div>
編者按:位于硅谷的非營(yíng)利組織OpenAI的研究人員開發(fā)的AI系統(tǒng)Dactyl能使機(jī)器手像人類一樣靈活操縱立方體。本文經(jīng)授權(quán)譯自MIT Technolog...

  編者按:位于硅谷的非營(yíng)利組織OpenAI的研究人員開發(fā)的AI系統(tǒng)Dactyl能使機(jī)器手像人類一樣靈活操縱立方體。本文經(jīng)授權(quán)譯自MIT Technology Review原標(biāo)題為" An AI-driven robot hand spent a hundred years teaching itself to rotate a cube"的文章。

  Dactyl AI的研究人員成功研究出一種自學(xué)算法,它能讓機(jī)器人的手具有很高的靈活性。他們研究出的算法使機(jī)器手能靈活地操縱一個(gè)立方體,這個(gè)過程在計(jì)算機(jī)模擬中相當(dāng)于進(jìn)行了百年的練習(xí)(盡管實(shí)際只有幾天的時(shí)間)。

  機(jī)器人的手還遠(yuǎn)不及人類的敏捷,而且如果想應(yīng)用在工廠或倉庫里也顯得太笨拙了。即便如此,這項(xiàng)研究依然顯示了機(jī)器學(xué)習(xí)的潛力。它還表明,有一天,機(jī)器人可能會(huì)在虛擬世界中自學(xué)新技能,這將大大加快編程或訓(xùn)練它們的進(jìn)程。

  這個(gè)機(jī)器人系統(tǒng)被稱為“Dactyl”,是由位于硅谷的非營(yíng)利組織OpenAI的研究人員開發(fā)的。它使用了一個(gè)來自英國(guó)公司稱為“影子”的現(xiàn)成的機(jī)器手,一個(gè)普通的相機(jī),以及一個(gè)已經(jīng)掌握了一個(gè)龐大的多人在線視頻游戲的DotA算法,它使用了同樣的自學(xué)方法。

  該算法使用一種稱為強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù)。Dactyl的任務(wù)是操縱一個(gè)立方體,把不同的面翻到上面來。通過不斷的試錯(cuò),會(huì)產(chǎn)生預(yù)期的結(jié)果。

  視頻顯示,Dactyl能夠非常敏捷地旋轉(zhuǎn)立方體。它自動(dòng)地找出了人類常用的幾個(gè)抓點(diǎn)。但這項(xiàng)研究也顯示了人工智能還有很長(zhǎng)的路要走:在經(jīng)過了數(shù)百年的虛擬訓(xùn)練之后,機(jī)器人成功地操縱了魔方的概率只有13/50,這遠(yuǎn)遠(yuǎn)超過了兒童所需要的時(shí)間。

  麻省理工學(xué)院名譽(yù)教授、Rethink Robotics公司的創(chuàng)始人Rodney Brooks表示:“短期內(nèi),它不適合被應(yīng)用于工業(yè)流程,但研究依然是一件好事?!?Rethink Robotics公司是一家生產(chǎn)更智能工業(yè)機(jī)器人的初創(chuàng)公司。

  強(qiáng)化學(xué)習(xí)的靈感來自于動(dòng)物通過積極反饋學(xué)習(xí)的方式。它最初在幾十年前就被提出了,但隨著人工神經(jīng)網(wǎng)絡(luò)的進(jìn)步,在最近幾年才被證明是可行的。Alphabet旗下的DeepMind利用強(qiáng)化學(xué)習(xí)技術(shù)創(chuàng)建了AlphaGo。這是一個(gè)計(jì)算機(jī)程序,它學(xué)會(huì)了高超的技能來玩極其復(fù)雜和微妙的棋盤游戲。

  其他機(jī)器人研究人員對(duì)這種方法進(jìn)行了一段時(shí)間的測(cè)試,但由于模仿現(xiàn)實(shí)世界的復(fù)雜性和不可預(yù)測(cè)性,他們一直難有突破。OpenAI的研究人員通過在虛擬世界中引入隨機(jī)變量來解決這個(gè)問題,這樣機(jī)器人就可以學(xué)習(xí)如何解釋諸如摩擦、機(jī)器人硬件噪音以及立方體部分處于視線之外的問題。

  該機(jī)器人背后的工程師之一Alex Ray表示,通過賦予它更強(qiáng)的處理能力和引入更多的隨機(jī)性,可以提高Dactyl的性能。“我認(rèn)為我們還沒有達(dá)到極限,”他說。Ray補(bǔ)充說,目前還沒有計(jì)劃將這項(xiàng)技術(shù)商業(yè)化。他的團(tuán)隊(duì)專注于開發(fā)最強(qiáng)的通用學(xué)習(xí)方法。

  “這很難做好,”密歇根大學(xué)專門研究機(jī)器操縱的專家Dmitry Berenson說,“目前還不清楚最新的機(jī)器學(xué)習(xí)方法將會(huì)帶來多大影響。我們付出了很多努力來為特定的任務(wù)提供合適的方法?!钡J(rèn)為,模擬學(xué)習(xí)可能是非常有用的:“如果我們能夠真正地跨越‘現(xiàn)實(shí)差距’,學(xué)習(xí)就會(huì)變得更加容易。

網(wǎng)友評(píng)論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞