Spaces:

izh97
/

Climate_Change_AIssistant

Paused

Update app.py

9602507 verified about 1 year ago

1.31 kB

	import gradio as gr
	import torch
	from transformers import AutoTokenizer, GenerationConfig
	from peft import AutoPeftModelForCausalLM
	tokenizer = AutoTokenizer.from_pretrained("izh97/zephyr-beta-climate-change-assistant")
	model = AutoPeftModelForCausalLM.from_pretrained(
	"izh97/zephyr-beta-climate-change-assistant",
	low_cpu_mem_usage=True,
	return_dict=True,
	torch_dtype=torch.float16,
	device_map="cuda")
	model = model.to('cuda:0')
	generation_config = GenerationConfig(
	do_sample=True,
	top_k=10,
	temperature=0.2,
	max_new_tokens=256,
	pad_token_id=tokenizer.unk_token_id
	)
	def ask(text):
	tokenizer = AutoTokenizer.from_pretrained("izh97/zephyr-beta-climate-change-assistant")
	model = AutoPeftModelForCausalLM.from_pretrained(
	"izh97/zephyr-beta-climate-change-assistant",
	low_cpu_mem_usage=True,
	return_dict=True,
	torch_dtype=torch.float16,
	device_map="cuda")

	inputs = tokenizer.apply_chat_template(text, tokenize=True, add_generation_prompt=True, return_tensors="pt").to("cuda")
	outputs = model.generate(**inputs, generation_config=generation_config,
	return_dict_in_generate=True)
	return tokenizer.decode(outputs[0], skip_special_tokens=True)
	iface = gr.Interface(fn=ask, inputs="text", outputs="text")
	iface.launch()