機(jī)器人也能“跑酷”,谷歌子公司DeepMind研發(fā)最新人工智能系統(tǒng)
點(diǎn)擊:1600
A+ A-
所屬頻道:新聞中心
IT之家7月11日消息 據(jù)外媒THEVERGE報(bào)道,最近,谷歌負(fù)責(zé)人工智能技術(shù)研發(fā)的子公司DeepMind正在研發(fā)一種名為“在復(fù)雜環(huán)境下運(yùn)動行為”的人工智能系統(tǒng)。這項(xiàng)研究探索了如何通過強(qiáng)化學(xué)習(xí)技術(shù)(或RL)控制計(jì)算機(jī)來導(dǎo)航不熟悉或復(fù)雜的環(huán)境。在未來,這項(xiàng)研究可以幫助機(jī)器人在陌生的環(huán)境中爬樓梯或者躲避障礙物。
在演示中,這個(gè)火柴棍一樣的小人自動完成了所有的動作。跳躍、躲避和下蹲,所有這些動作都是計(jì)算機(jī)自行設(shè)計(jì)的行為,并且獲得從A到B的最佳途徑,而DeepMind的程序員要做的,只是給配備一組虛擬的傳感器,然后觸發(fā)使其前進(jìn)。
圖片源自外媒THEVERGE
研究人員正在探索如何讓人工智能機(jī)器人在復(fù)雜的環(huán)境下進(jìn)行復(fù)雜并且正確的動作。一般而言,強(qiáng)化學(xué)習(xí)產(chǎn)生的行為很脆弱,從一個(gè)熟悉到不熟悉的環(huán)境中,往往很難適應(yīng)。比如一個(gè)會在家里爬樓梯的嬰兒,卻無法自己學(xué)會乘坐電梯。
而現(xiàn)在這項(xiàng)研究證明,通過強(qiáng)化學(xué)習(xí)技術(shù)可以使人工智能系統(tǒng)處理更復(fù)雜的運(yùn)動。
(審核編輯: 林靜)
分享