Spaces:

atlasia
/

Al-Atlas-LLM

Running on Zero

BounharAbdelaziz commited on 4 days ago

Commit

3c73224

verified ·

1 Parent(s): 01090a1

fix of endless loop in generate

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,6 +17,10 @@ MODEL_NAME = "BounharAbdelaziz/Al-Atlas-LLM-0.5B" # "atlasia/Al-Atlas-LLM-mid-tr
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME) # , token=token
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)
 # Predefined examples
 examples = [
     ["الذكاء الاصطناعي هو فرع من علوم الكمبيوتر اللي كيركز"
@@ -42,6 +46,8 @@ def generate_text(prompt, max_length=256, temperature=0.7, top_p=0.9, top_k=150,
         num_beams=num_beams,
         top_k= top_k,
         early_stopping = True,
     )
     return tokenizer.decode(output[0], skip_special_tokens=True)

 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME) # , token=token
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)
+# Fix tokenizer padding
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token  # Set pad token
 # Predefined examples
 examples = [
     ["الذكاء الاصطناعي هو فرع من علوم الكمبيوتر اللي كيركز"
         num_beams=num_beams,
         top_k= top_k,
         early_stopping = True,
+        pad_token_id=tokenizer.pad_token_id,  # Explicit pad token
+        eos_token_id=tokenizer.eos_token_id,  # Explicit eos token
     )
     return tokenizer.decode(output[0], skip_special_tokens=True)