dest1n1
/

test-repo

dest1n1 commited on Jun 6, 2024

Commit

8ee6999

verified ·

1 Parent(s): 411b956

Upload pretrained SAE model. Hook point: blocks.3.hook_mlp_out. Language Model Name: gpt2

Files changed (4) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+blocks.3.hook_mlp_out/sae_weights.safetensor filter=lfs diff=lfs merge=lfs -text

blocks.3.hook_mlp_out/hyperparams.json ADDED Viewed

+{
+    "hook_point_in": "blocks.3.hook_mlp_out",
+    "hook_point_out": "blocks.3.hook_mlp_out",
+    "use_decoder_bias": false,
+    "apply_decoder_bias_to_pre_encoder": true,
+    "decoder_bias_init_method": "geometric_median",
+    "expansion_factor": 32,
+    "d_model": 768,
+    "d_sae": 24576,
+    "norm_activation": "token-wise",
+    "decoder_exactly_unit_norm": false,
+    "use_glu_encoder": false,
+    "l1_coefficient": 0.00012,
+    "lp": 1,
+    "use_ghost_grads": true
+}

blocks.3.hook_mlp_out/lm_config.json ADDED Viewed

+{
+    "model_name": "gpt2",
+    "model_from_pretrained_path": null,
+    "cache_dir": null,
+    "d_model": 768,
+    "local_files_only": false
+}

blocks.3.hook_mlp_out/sae_weights.safetensor ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:70a60affc950adf2d76fafeee437a4205b9292d2915792bdea5edcd96ec04475
+size 151290320