Kiss Mihaly commited on
Commit
a0f3e7c
·
verified ·
1 Parent(s): 89801c9

Upload folder using huggingface_hub

Browse files
Files changed (4) hide show
  1. Sokoban-A2C-CNN5.zip +2 -2
  2. Sokoban-A2C-CNN6.zip +3 -0
  3. Sokoban-A2C-CNN7.zip +3 -0
  4. agent.py +32 -32
Sokoban-A2C-CNN5.zip CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:8983aa53b7414466ea1c1855b530827bd71528f0f7aa64a70a750844992e6c4c
3
- size 15276121
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cee537a4dafdf298a59b47718fb12f3291dbac6bea11d0839d1fa0711ee61fa1
3
+ size 15277144
Sokoban-A2C-CNN6.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cd6959441e213b244801a02ebd3cedbcaaee70fa11fdd2089bbf479f770f244c
3
+ size 15277144
Sokoban-A2C-CNN7.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:704c789fd5a0fdedf3f1af1fe94aa367f748831edd6e7b824e59cce261a7775e
3
+ size 15274932
agent.py CHANGED
@@ -1,33 +1,33 @@
1
- from stable_baselines3 import PPO
2
- from sokoban_gym.wrappers.observation import ImageObservationWrapper
3
-
4
- class Agent:
5
- """
6
- A kötelező programként beadandó ágens leírása.
7
- """
8
-
9
- def __init__(self, env) -> None:
10
- """
11
- A konsztruktorban van lehetőség például a modell betöltésére
12
- vagy a környezet wrapper-ekkel való kiterjesztésére.
13
- """
14
-
15
- self.model = PPO.load("agent/Sokoban-A2C-CNN5")
16
-
17
- # A környezetet kiterjeszthetjük wrapper-ek segítségével.
18
- # Ha tanításkor modosítottuk a megfigyeléseket,
19
- # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
20
- self.observation_wrapper = ImageObservationWrapper(env)
21
-
22
- def act(self, observation):
23
- """
24
- A megfigyelés alapján visszaadja a következő lépést.
25
- Ez a függvény fogja megadni az ágens működését.
26
- """
27
-
28
- # Ha tanításkor modosítottuk a megfigyeléseket,
29
- # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
30
- extended_obsetvation = self.observation_wrapper.observation(observation)
31
-
32
- return self.model.predict(extended_obsetvation, deterministic=True)
33
 
 
1
+ from stable_baselines3 import PPO
2
+ from sokoban_gym.wrappers.observation import ImageObservationWrapper
3
+
4
+ class Agent:
5
+ """
6
+ A kötelező programként beadandó ágens leírása.
7
+ """
8
+
9
+ def __init__(self, env) -> None:
10
+ """
11
+ A konsztruktorban van lehetőség például a modell betöltésére
12
+ vagy a környezet wrapper-ekkel való kiterjesztésére.
13
+ """
14
+
15
+ self.model = PPO.load("agent/Sokoban-A2C-CNN7")
16
+
17
+ # A környezetet kiterjeszthetjük wrapper-ek segítségével.
18
+ # Ha tanításkor modosítottuk a megfigyeléseket,
19
+ # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
20
+ self.observation_wrapper = ImageObservationWrapper(env)
21
+
22
+ def act(self, observation):
23
+ """
24
+ A megfigyelés alapján visszaadja a következő lépést.
25
+ Ez a függvény fogja megadni az ágens működését.
26
+ """
27
+
28
+ # Ha tanításkor modosítottuk a megfigyeléseket,
29
+ # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
30
+ extended_obsetvation = self.observation_wrapper.observation(observation)
31
+
32
+ return self.model.predict(extended_obsetvation, deterministic=True)
33