ontocord
/

Llama_3.2_1b-autoredteam_helpfulness-train

Harsh1729 commited on 4 days ago

Commit

874670b

verified ·

1 Parent(s): 7017142

Upload model_params.json with huggingface_hub

Files changed (1) hide show

model_params.json ADDED Viewed

+{
+    "cache_dir": "/leonardo_work/EUHPC_E03_068/.cache",
+    "method": "orpo",
+    "dataset": "autoredteam",
+    "model": "meta-llama/Llama-3.2-1B",
+    "tokenizer": "meta-llama/Llama-3.2-1B-instruct",
+    "train_data_path": "/leonardo_work/EUHPC_E03_068/datasets/working/autoredteam_helpfulness_v1-train.jsonl",
+    "test_data_path": "/leonardo_work/EUHPC_E03_068/datasets/working/autoredteam_helpfulness_v1-test.jsonl",
+    "lr": 0.01,
+    "train_batch_size": 300,
+    "eval_batch_size": 300,
+    "num_epochs": 1,
+    "seed": 42,
+    "eval_only": false,
+    "evaluation_size": null,
+    "gradient_accumulation_steps": 2,
+    "checkpoint_path": null,
+    "experiment_name": "Llama_3.2_1b-autoredteam_helpfulness-train",
+    "experiment_group": "results",
+    "reference_model": null,
+    "context_length": 1024,
+    "train_summarization": "",
+    "dpo_beta": 0.1,
+    "orpo_beta": 0.1,
+    "kl_coef": 0.0,
+    "reward_model": "",
+    "bestofn_size": 4,
+    "train_reward_model": "",
+    "max_steps": 5511
+}