Initial commit

Files changed (9) hide show

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ model-index:
   results:
   - metrics:
     - type: mean_reward
-      value: 1735.00 +/- 817.86
       name: mean_reward
     task:
       type: reinforcement-learning

   results:
   - metrics:
     - type: mean_reward
+      value: 2581.50 +/- 1151.96
       name: mean_reward
     task:
       type: reinforcement-learning

args.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - algo
     - qrdqn
   - - device
-    - auto
   - - env
     - SpaceInvadersNoFrameskip-v4
   - - env_kwargs
@@ -10,7 +10,7 @@
   - - eval_episodes
     - 5
   - - eval_freq
-    - 25000
   - - gym_packages
     - []
   - - hyperparams
@@ -30,7 +30,7 @@
   - - n_startup_trials
     - 10
   - - n_timesteps
-    - -1
   - - n_trials
     - 500
   - - no_optim_plots
@@ -46,17 +46,17 @@
   - - sampler
     - tpe
   - - save_freq
-    - -1
   - - save_replay_buffer
     - false
   - - seed
-    - 3599463833
   - - storage
     - null
   - - study_name
     - null
   - - tensorboard_log
-    - runs/SpaceInvadersNoFrameskip-v4__qrdqn__3599463833__1654903955
   - - track
     - true
   - - trained_agent
@@ -66,7 +66,7 @@
   - - uuid
     - false
   - - vec_env
-    - dummy
   - - verbose
     - 1
   - - wandb_entity

 - - - algo
     - qrdqn
   - - device
+    - cuda
   - - env
     - SpaceInvadersNoFrameskip-v4
   - - env_kwargs
   - - eval_episodes
     - 5
   - - eval_freq
+    - 100000
   - - gym_packages
     - []
   - - hyperparams
   - - n_startup_trials
     - 10
   - - n_timesteps
+    - 12000000
   - - n_trials
     - 500
   - - no_optim_plots
   - - sampler
     - tpe
   - - save_freq
+    - 100000
   - - save_replay_buffer
     - false
   - - seed
+    - 2067843970
   - - storage
     - null
   - - study_name
     - null
   - - tensorboard_log
+    - runs/SpaceInvadersNoFrameskip-v4__qrdqn__2067843970__1654945769
   - - track
     - true
   - - trained_agent
   - - uuid
     - false
   - - vec_env
+    - subproc
   - - verbose
     - 1
   - - wandb_entity

qrdqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbca1509177de2712c4eee4240b32bcba3ece65d9b683c079ba999e11ef44824
-size 37022454

 version https://git-lfs.github.com/spec/v1
+oid sha256:3845f344e13a6d0713aec0eeae1bfe80c5964846a35c36dcef2bdd5cefe8b93b
+size 37022471

qrdqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

qrdqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa2bacb96ec64d55f1066e7fc7b0a15465669ba74fe6190df0816ff21d67224b
 size 18403305

 version https://git-lfs.github.com/spec/v1
+oid sha256:7573ae50b5cb24797da35f809d576bbb5dc92850dc8d3a478606ef0c8ea60f1e
 size 18403305

qrdqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48b0fdf4647e5ba9ec9b3a01b4575a4891313dad57389175f0bf8656e4494dcd
 size 18405545

 version https://git-lfs.github.com/spec/v1
+oid sha256:3917d4b306b6705fed0a81970bfbad19d2f14cf9f922ca721cffee493beac6fa
 size 18405545

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44921ebe9f07f8eb0ddb8ebbce8de8f7922014f2dfb39aaa956a3037dc6d881f
-size 162759

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d7c2d30fb654b1a777ab4113aa806b68ecd352805960a60ca6ce8520c62180e
+size 206838

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~1735~~.0, "std_reward": ~~817~~.~~8630692236935~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-06-~~11T11~~:29:55.~~096517~~"}


1	+ {"mean_reward": 2581.5, "std_reward": 1151.9614793906956, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-06-11T21:51:32.705133"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f7087ad3805c9cfd5dfd2e50d3509f63096ae159ce7898bf39262ab0b4d5dc52
-size 258495

 version https://git-lfs.github.com/spec/v1
+oid sha256:2eb27c5fe4bded2ad38ca89accd50cadf4396a9958c18a456b6adcdb8b6401d2
+size 255432