Training in progress, step 600

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -9,8 +9,8 @@
   "layers_pattern": null,
   "layers_to_transform": null,
   "loftq_config": {},
-  "lora_alpha": 16,
-  "lora_dropout": 0.1,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,
@@ -19,13 +19,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "v_proj",
-    "gate_proj",
     "up_proj",
     "o_proj",
-    "q_proj",
     "k_proj",
-    "down_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_rslora": false

   "layers_pattern": null,
   "layers_to_transform": null,
   "loftq_config": {},
+  "lora_alpha": 8,
+  "lora_dropout": 0.05,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "up_proj",
+    "down_proj",
     "o_proj",
     "k_proj",
+    "v_proj",
+    "gate_proj",
+    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_rslora": false

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b57ea5a1ef855f82289c8f361d8ef315ad65ad3e8fa8ebe4e0cfa3f79daf85c3
 size 639691872

 version https://git-lfs.github.com/spec/v1
+oid sha256:3045d4b53a766449f8668b330b3cd3b971e0e17f5f90f5dd7cf7d877fb9c79fc
 size 639691872

angle.config CHANGED Viewed

@@ -6,17 +6,17 @@
   "lora_config_kwargs": {
     "task_type": "CAUSAL_LM",
     "r": 64,
-    "lora_alpha": 16,
-    "lora_dropout": 0.1,
     "bias": "none",
     "target_modules": [
-      "v_proj",
-      "gate_proj",
-      "up_proj",
       "o_proj",
-      "q_proj",
       "k_proj",
-      "down_proj"
     ]
   },
   "apply_lora": 1

   "lora_config_kwargs": {
     "task_type": "CAUSAL_LM",
     "r": 64,
+    "lora_alpha": 8,
+    "lora_dropout": 0.05,
     "bias": "none",
     "target_modules": [
+      "down_proj",
       "o_proj",
+      "v_proj",
       "k_proj",
+      "up_proj",
+      "gate_proj",
+      "q_proj"
     ]
   },
   "apply_lora": 1

runs/Mar24_10-47-38_instance-20240226-074643/events.out.tfevents.1711277263.instance-20240226-074643.300367.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a1943a54f59c29a67d1daec8494ad86f36b74cd89888f2d063ba598c77972b6
-size 12587

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc396ec7b0976124cd4c84b0297d17769b5d16d6262c48b7318bda8030b7bc4d
+size 12941

runs/Mar25_00-38-15_instance-20240226-074643/events.out.tfevents.1711327099.instance-20240226-074643.678920.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4015acffea7631cc7edd489f5804a7c2df70af2e0dffa9f9ca376275daa834b6
+size 6468

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d25ac5d64e6b4d88ac8b861ed2a41d07744dcd0874dd58e5ddbad7c2e928dfb
 size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:0fb9527e14cb8b3ca4d8e0759e3c1bc0a71a0a26b94f93e690e0b6463819110d
 size 5048