fbpx

在 AlphaGo 戰勝世界棋王之後,他們目標是讓 AI 攻略經典遊戲

DeepMind 利用 AlphaGo 證實了 Deep Learning 的可能性,他們幾次戰勝世界圍棋棋王,發展到後期可以「自我學習」成為大師級棋手,這深深的震撼了世界。而 DeepMind 下一個目標是利用 AI 攻略 Atari 的經典遊戲,他們的學習方式亦很特別-讓 AI 自己在 Youtube 上面看影片。

熟知 AI 的工程帥都知道他們的限制是什麼,沒錯他們對於「模式」、「學習」的敏感度相當高,對於有明確規則、方法的圍棋來說他們無須窮舉所有可能性,只需要知道導向勝利的模式就可以了(無疑 DeepMind 使用的蒙地卡羅演算法是很聰明);同時這個方式的限制只能做出「弱人工智能」,也就是為特定目標而生的 AI ,假設你把 AlphaGo 用於圖片辨識,數據模型將完全用不上,反之亦然。

那麼問題來了,對於一些經典的遊戲例如 Pitfall or Montezuma’s Revenge 或是 Super Mario Bro ,他們又可以如何去學習呢?人類有判斷能力,當我們在遊戲「卡關」的時侯可以嘗試尋找提示,亦會嘗試不同的方向,但 AI 要從新學習一個全新的模式需要時間,這是他們相當不同的地方,也是攻略 Atari 遊戲的挑戰所在。

在 DeepMind 的白皮書上面亦提到電子遊戲的可能性太多,加上每一個關卡需要的事情都不盡相同,他們亦懷疑實際上是否有一個可能學習的方針。而最近他們解決的方式,就是利用觀察真正人類在玩遊戲的影片,再去模擬上他們「思考」的方式。最終他們希望嘗試這個模型是否可能讓 AI 靠著觀察環境去產生判斷,從而可以開發出火星索的人工智能。
到底他們能夠成功嗎?我們相當期待進一步的研究成果!

引用來源:The Next Web

TechApple.com 編輯部

堅持製作專業科技內容,全員擁有多種不同技術知識的特異科技媒體團隊

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

限制時效已用盡。請重新載入驗證碼。