Spaces:

vilarin
/

LLaMAX3-Translator

Running on Zero

vilarin commited on Jul 25, 2024

Commit

0a38613

verified ·

1 Parent(s): 112e28c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import torch
 from PIL import Image
 import gradio as gr
 import spaces
-from transformers import LlamaForCausalLM, AutoTokenizer, BitsAndBytesConfig, TextIteratorStreamer
 import os
 from threading import Thread
 from polyglot.detect import Detector
@@ -15,7 +15,7 @@ TITLE = "<h1><center>LLaMAX3-8B-Translation</center></h1>"
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
-model = LlamaForCausalLM.from_pretrained(
         MODEL,
         torch_dtype=torch.bfloat16,
         device_map="auto",
@@ -61,12 +61,12 @@ def translate(
     print(f'Text is - {source_text}')
     prompt = Prompt_template(source_text, source_lang, target_lang)
-    inputs = tokenizer(prompt, return_tensors="pt")
     streamer = TextIteratorStreamer(tokenizer, **{"skip_special_tokens": True, "skip_prompt": True, 'clean_up_tokenization_spaces':False,})
     generate_kwargs = dict(
-        inputs.input_ids,
         streamer=streamer,
         max_length=max_length,
         do_sample=True,

 from PIL import Image
 import gradio as gr
 import spaces
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, TextIteratorStreamer
 import os
 from threading import Thread
 from polyglot.detect import Detector
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
+model = AutoModelForCausalLM.from_pretrained(
         MODEL,
         torch_dtype=torch.bfloat16,
         device_map="auto",
     print(f'Text is - {source_text}')
     prompt = Prompt_template(source_text, source_lang, target_lang)
+    input_ids = tokenizer(prompt, return_tensors="pt").to(model.device)
     streamer = TextIteratorStreamer(tokenizer, **{"skip_special_tokens": True, "skip_prompt": True, 'clean_up_tokenization_spaces':False,})
     generate_kwargs = dict(
+        input_ids=input_ids,
         streamer=streamer,
         max_length=max_length,
         do_sample=True,