OpenAI gym 例子

OpenAI gym 例子

接下來我們以遊戲環境,Mountain Car-v0為例,來展示OpenAI gym的使用。 Mountain Car是一個要讓小車爬上山的一個遊戲,他的action有三個值, 而observation有兩個值,分別為車的位置及速度。

使用OpenAI gym程式碼

這裡我們創建一個名為env的mountain car環境, 之後再設定他錄的影片的儲存位置,並每10step錄一次。

接下來,設定迴圈跑50次,每次開始前都用env.reset() 刷新一次,之後在每次的遊戲都選擇一個action,取得新的observation, 再根據結果學習,如此反覆。
最後關閉錄製。


2. OpenAI gym 影片展示

Mountain Car step 0:

Mountain Car step 20:


Carpole step 75:

Carpole step 1500: