Spaces:

1inkusFace
/

qwen2.5-32b-instruct

Running on Zero

1inkusFace commited on 26 days ago

Commit

dd12d34

verified ·

1 Parent(s): b7ad091

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,15 +27,17 @@ def generate_code(prompt):
         add_generation_prompt=True
     )
     model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
-    with torch.no_grad():
-        generated_ids = model.generate(
-            **model_inputs,
-            max_new_tokens=1024
-        )
-    generated_ids = [
-        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
-    ]
-    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
     return response
 with gr.Blocks(title="Qwen 14b") as demo:  # Updated title

         add_generation_prompt=True
     )
     model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
+    #with torch.no_grad():
+    generated_ids = model.generate(
+        **model_inputs,
+        max_length = 1024,
+        min_new_tokens = 256,
+        #low_memory = True,
+        token_healing = True,
+        guidance_scale = 3.8,
+    )
+    generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
+        response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
     return response
 with gr.Blocks(title="Qwen 14b") as demo:  # Updated title