OpenAI gym 例子
OpenAI gym 例子
接下來我們以遊戲環境,Mountain Car-v0為例,來展示OpenAI gym的使用。
Mountain Car是一個要讓小車爬上山的一個遊戲,他的action有三個值,
而observation有兩個值,分別為車的位置及速度。
使用OpenAI gym程式碼
這裡我們創建一個名為env的mountain car環境,
之後再設定他錄的影片的儲存位置,並每10step錄一次。
接下來,設定迴圈跑50次,每次開始前都用
env.reset()
刷新一次,之後在每次的遊戲都選擇一個action,取得新的observation,
再根據結果學習,如此反覆。
最後關閉錄製。
2. OpenAI gym 影片展示
Mountain Car step 0:
Mountain Car step 20:
Carpole step 75:
Carpole step 1500: