機器人也會踢足球!深度學習比人工設計更強
編譯/曲姵蓉
人工智慧巨頭公司Google DeepMind近日發布一篇「學習具敏捷性的足球技巧:用深度強化學習培養雙足機器人」論文,成功利用深度學習技術(Deep Learning),讓機器人自己學會踢足球。
根據報導,深度學習架構是一種用來訓練神經網路的方法,它讓機器人可以透過試驗與練習,逐步學習並改進做事情的方法。團隊指出,他們利用擁有20個驅動關節的Robotis OP3機器人,並花費14小時教會機器人跌倒後如何起身,再花158小時訓練機器人站立、踢球以及轉身等單一動作。
最後,在經過68小時的機器人自我練習後,機器人成功學會了踢球必備的組合技。研究團隊發現,Robotis OP3透過深度學習,可以逐步適應動作,並展現出強大的動態運動技術,甚至超越原本團隊對Robotis OP3的期望。
而且,為了訓練機器人可以重複這些動作,僅僅提供它射門後的獎勵是不夠的,研究團隊還必須設定不同的階段獎勵或者訓練目標,讓機器人即使跌倒了也可以不斷爬起來,努力打敗對手。
研究團隊也必須要針對機器人的每個動作進行細節設定,當機器人跌倒時,必須要訓練其自己站起來後重新進行踢球的動作,不然機器人可能就會採取當下它判斷最有效率,但並不是人類希望它做的事情,例如透過在地上滾動得分。當機器人的跌倒爬起訓練,以及進球策略完全結合時,再幫它設定一個進球的獎勵過程,就可以獲得努力踢球的機器人了。
實驗後發現,利用深度學習訓練的機器人,會比人類特別用手動設計程式的機器人還要更厲害。以此次Robotis OP3為例,利用深度學習的機器人行走速度比一般機器人還要快156%,跌倒後爬起速度快了63%。而且,透過深度學習的Robotis OP3機器人核心軟體,可以直接移植到其他機器人身上,不需要重新進行額外培訓,就可以快速大量地擁有會踢足球的機器人,這對於人類未來的機器人訓練以及應用,有重大的貢獻。
資料來源:The Register
瀏覽 910 次