fbpx

Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結)

Google 在人工智能上掌握了不少技術,而他們亦願意跟人分享。近日 Google 宣佈,將強化學習框架放在 GitHub 上開源提供,讓其他的開發者也可以使用這個技術並參與研發。

Google 開放訓練用強化學習框架:用於訓練 AI 模型

這次的強化學習框架是 Google 子公司核心部分 DeepMind 的深度 Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現“超人”性能。不過要使用強化學習框架來訓練相當花時間,而且穩定性不高。

Google 今次在 GitHub 開放的強化學習框架則是基於 TensorFlow 機器學習庫之上開發,讓開發者可以利用這個開源工具,令人工智能可以擁有更好的訓練方式。

Google Brain Team 的研究員 Pablo Samuel Castro 和 Marc G. Bellemare 在網誌中表示,這個工具的靈感來自大腦獎勵動機行為的主要組成部分,反映了神經科學與強化學習研究之間強大的連結。這次公開強化學習框架,是希望能協助研究,促進更大型的新發現。這強化學習框架的主要特點為彈性、穩定性以及可再現性,解決在開發過程中面對的主要問題。

他們和 Google Brain 團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。

為此,它包括一套包括15個Python文件的代碼、用視頻遊戲評估AI技術的平台,以及四種不同的機器學習模型。

除了增強框架的發布,谷歌還推出了一個網站,允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型,原始統計日誌和TensorFlow事件文件,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

Google 方面已經把這個強化學習框架投入到不同範疇的人工智能研究之中,據稱在使用過程中,他們發現可以更彈性去讓他們實現不同的想法。Google 希望未來在開源之後,可以看到開發者社群應用這個工具,為人工智能帶來更多的新發展。

有興趣的可以自己到 Github 參考原始碼。

資料來源:venturebeat

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

限制時效已用盡。請重新載入驗證碼。