Spaces:

phucdt89s
/

vinallama-7b-chat

Runtime error

phucdt89s commited on Dec 24, 2024

Commit

a17b1be

verified ·

1 Parent(s): 66cd024

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,21 @@
-import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
-import gradio as gr
-# Load model and tokenizer
-MODEL_NAME = "vilm/vinallama-7b-chat"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, torch_dtype=torch.float16, device_map="auto")
-# Define chatbot function
-def chatbot(input_text):
-    inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
-    outputs = model.generate(inputs["input_ids"], max_length=200, do_sample=True, temperature=0.7)
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return response
-# Create Gradio interface
-interface = gr.Interface(fn=chatbot, inputs="text", outputs="text", title="Vinamallama 7B Chatbot")
-# Launch app
-interface.launch()

+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import gradio as gr
+# Load model and tokenizer
+MODEL_NAME = "vilm/vinallama-7b-chat"
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
+# Define chatbot function
+def chatbot(input_text):
+    inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
+    outputs = model.generate(inputs["input_ids"], max_length=200, do_sample=True, temperature=0.7)
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return response
+# Create Gradio interface
+interface = gr.Interface(fn=chatbot, inputs="text", outputs="text", title="Vinamallama 7B Chatbot")
+# Launch app
+interface.launch()