entry_point
, max_episode_steps
, reward_threshold
)の一覧(registry情報)を見れるmax_episode_steps
とreward_threshold
の違いであることがわかる。$ pip install gym
A. ライブラリのインストールやアニメーション表示が問題になりますが,そこそこにはなんとかなります。以下を見てください。
A. max_episode_steps の値を調整する。
env.tags['wrapper_config.TimeLimit.max_episode_steps'] = 500
register(
id='CartPole-v1',
entry_point='gym.envs.classic_control:CartPoleEnv',
tags={'wrapper_config.TimeLimit.max_episode_steps': 500},
reward_threshold=475.0,
)
idの名前を変えれば,仮に違う名前の環境として定義できる。
参考URL: How to configure the cartpole environment such that it is not capped at 200?
方法1
以下のように引数is_sleppery
を使って,決定論的状態遷移に変更できる。
env = gym.make("FrozenLake-v0", is_slippery=False)
方法2
以下のような設定を加える。ついでに,他のパラメータ設定もできる。
from gym.envs.registration import register
register(
id='FrozenLakeNotSlippery-v0',
entry_point='gym.envs.toy_text:FrozenLakeEnv',
kwargs={'map_name' : '4x4', 'is_slippery': False},
max_episode_steps=100,
reward_threshold=0.78, # optimum = .8196
)
環境名(id)は自由に変えられる。上記の場合はFrozenLakeNotSlippery-v0