數(shù)字標(biāo)牌網(wǎng) 服務(wù)熱線:400-6787-360 | 投稿郵箱 | 會(huì)員登錄 | 免費(fèi)注冊 | 設(shè)為首頁 | 加入收藏 | RSS | 客戶服務(wù) | 月刊訂閱 | |||
|
![]() |
康奈爾大學(xué)個(gè)人機(jī)器人實(shí)驗(yàn)室的一只機(jī)器人已經(jīng)學(xué)會(huì)預(yù)測人類行為,在不需要交互的情況下,自動(dòng)瞅準(zhǔn)時(shí)間走過來提供服務(wù)。上面的視頻首先展示了機(jī)器人是如何幫助研究人員打開冰箱門;接著,它通過預(yù)測人類行為來防止把啤酒誤倒在桌子上。(不過,這只機(jī)器人是不是還沒學(xué)會(huì)怎么抓冰箱門把手,居然拽著一條毛巾來開門!)
要在什么時(shí)候、什么地方為主人倒一杯啤酒?什么時(shí)候幫主人打開冰箱門?對于機(jī)器人來說這些可都不是簡單的問題,畢竟在它對當(dāng)前環(huán)境做出評(píng)估和反饋的過程中存在著太多的變量。現(xiàn)在,康奈爾大學(xué)的計(jì)算機(jī)科學(xué)研究人員找到了解決方案。
他們的機(jī)器人通過一臺(tái) Kinect 3D 攝像頭獲得視野,同時(shí)配有一個(gè)3D視頻數(shù)據(jù)庫,進(jìn)而利用這兩者辨別它所看到的人類活動(dòng)。機(jī)器人會(huì)考慮視野中的物體的可能用途,并判斷這些可能的用途與當(dāng)前人類活動(dòng)的匹配程度,然后生成一組人類未來可能會(huì)做出的動(dòng)作,最后選擇其中可能性最高的一個(gè)來應(yīng)對。隨著人類活動(dòng)的繼續(xù),它會(huì)更新并修正自己的預(yù)測結(jié)果。
例如,視頻中的機(jī)器人看到研究人員拿起小鍋并面朝冰箱后,給出了兩個(gè)高優(yōu)先級(jí)的預(yù)測結(jié)果:放下小鍋,或者將其放入冰箱。等看到研究人員走向冰箱后,機(jī)器人就可以確定他要將小鍋放入冰箱,隨后就自動(dòng)過來打開冰箱門。在為研究人員倒啤酒的過程中也進(jìn)行了相似的處理。
康奈爾大學(xué)計(jì)算機(jī)科學(xué)教授阿莎托什•賽科森納(Ashutosh Saxena)說:“我們提煉出了人類行為的一般法則。拿喝咖啡來說,它是一項(xiàng)完整的人類活動(dòng),卻也是由多個(gè)一般性動(dòng)作組成的。”他還解釋道,機(jī)器人為這些一般性動(dòng)作建立了一個(gè)“庫”,并能以不同的方式將這些動(dòng)作進(jìn)行組合,從而可以識(shí)別出各種不同的完整動(dòng)作。
在測試中,機(jī)器人預(yù)測未來一秒內(nèi)活動(dòng)的準(zhǔn)確率高達(dá)82%,預(yù)測未來三秒內(nèi)活動(dòng)的準(zhǔn)確率也達(dá)到了71%,預(yù)測未來十秒內(nèi)活動(dòng)的準(zhǔn)確降幅較大,但依然達(dá)到了57%。
賽科森納說:“雖說人類行為是可以預(yù)測的,但也并非永遠(yuǎn)可以。現(xiàn)在我們差不多是在給機(jī)器人硬編碼各種響應(yīng)行為,未來將研究機(jī)器人響應(yīng)行為的形成機(jī)理,讓它自己學(xué)會(huì)如何做出響應(yīng)。”
下個(gè)月,賽科森納將分別在美國亞特蘭大的機(jī)器學(xué)習(xí)國際會(huì)議和德國柏林的科學(xué)與系統(tǒng)工程會(huì)議上展示他們的研究成果。
這項(xiàng)研究收到了美國軍方、斯隆基金會(huì)和微軟公司的資助。