Spaces:

izh97
/

Climate_Change_AIssistant

Paused

izh97 commited on Feb 8, 2024

Commit

1580888

verified ·

1 Parent(s): 9602507

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,17 +18,17 @@ generation_config = GenerationConfig(
     pad_token_id=tokenizer.unk_token_id
 )
 def ask(text):
-  tokenizer = AutoTokenizer.from_pretrained("izh97/zephyr-beta-climate-change-assistant")
-  model = AutoPeftModelForCausalLM.from_pretrained(
-    "izh97/zephyr-beta-climate-change-assistant",
-    low_cpu_mem_usage=True,
-    return_dict=True,
-    torch_dtype=torch.float16,
-    device_map="cuda")
-  inputs = tokenizer.apply_chat_template(text, tokenize=True, add_generation_prompt=True, return_tensors="pt").to("cuda")
-  outputs = model.generate(**inputs, generation_config=generation_config,
                            return_dict_in_generate=True)
-  return tokenizer.decode(outputs[0], skip_special_tokens=True)
 iface = gr.Interface(fn=ask, inputs="text", outputs="text")
 iface.launch()

     pad_token_id=tokenizer.unk_token_id
 )
 def ask(text):
+  messages = [
+    {
+        "role": "user",
+        "content": str(text),
+    },
+  ]
+  inputs = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to("cuda")
+  inputs_length = inputs.shape[1]
+  outputs = model.generate(inputs, generation_config=generation_config,
                            return_dict_in_generate=True)
+  outputs = outputs.sequences[0, inputs_length:]
+  return tokenizer.decode(outputs, skip_special_tokens=True)
 iface = gr.Interface(fn=ask, inputs="text", outputs="text")
 iface.launch()