{"h_size": 16, "buffer_size": 5, "batch_size": 128, "n_training_episodes": 10000, "n_evaluation_episodes": 10, "max_t": 300, "gamma": 1.0, "lr_actor": 0.001, "lr_critic": 0.001, "env_id": "CartPole-v1", "state_space": 4, "action_space": 2}