Spaces:

Dovakiins
/

qwerrwe

Build error

winglian commited on May 8, 2024

Commit

796a085

unverified ·

1 Parent(s): cb78a36

make sure to save the lora adapter at the end of RL/dpo training (#1573)

Files changed (1) hide show

src/axolotl/train.py CHANGED Viewed

@@ -212,6 +212,10 @@ def train(
         if cfg.flash_optimum and BetterTransformer:
             model = BetterTransformer.reverse(model)
         model.save_pretrained(cfg.output_dir, safe_serialization=safe_serialization)
     if not cfg.hub_model_id:

         if cfg.flash_optimum and BetterTransformer:
             model = BetterTransformer.reverse(model)
+        if cfg.rl and cfg.adapter and not cfg.rl_adapter_ref_model:
+            trainer.model.save_pretrained(
+                cfg.output_dir, safe_serialization=safe_serialization
+            )
         model.save_pretrained(cfg.output_dir, safe_serialization=safe_serialization)
     if not cfg.hub_model_id: