Spaces:

aauu1234
/

roleplay2

Runtime error

App Files Files Community

aauu1234 commited on Sep 7, 2024

Commit

8d7f304

1 Parent(s): 8d2d7f7

wsw

Browse files

Files changed (2) hide show

app.py +12 -24
bak2.txt +71 -0

app.py CHANGED Viewed

@@ -7,30 +7,18 @@ import traceback
 model_name_or_path = "ClosedCharacter/Peach-9B-8k-Roleplay"
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
-model = AutoModelForCausalLM.from_pretrained(
-    model_name_or_path, torch_dtype=torch.bfloat16,
-    trust_remote_code=True)
-"""
-messages = [
-    {"role": "system", "content": "你是黑丝御姐"},
-    {"role": "user", "content": "你好，你是谁"},
-]
-input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, return_tensors="pt")
-output = model.generate(
-    inputs=input_ids.to("cpu"),
-    do_sample=True,
-    temperature=0.3,
-    top_p=0.5,
-    no_repeat_ngram_size=6,
-    repetition_penalty=1.1,
-    max_new_tokens=512)
-generated_response = tokenizer.decode(output[0])
-print("Generated response:", generated_response)
-print("First response to 'hi user first':", "你好，我是你的黑丝御姐？")
-"""
 def slow_echo(system_message, user_message):
     try:
         messages = [
@@ -38,9 +26,9 @@ def slow_echo(system_message, user_message):
             {"role": "user", "content": user_message},
         ]
-        input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, return_tensors="pt")
         output = model.generate(
-            inputs=input_ids.to("cpu"),
             do_sample=True,
             temperature=0.3,
             top_p=0.5,
@@ -64,7 +52,7 @@ iface = gr.Interface(
         gr.Textbox(label="User Message")
     ],
     outputs=gr.Textbox(label="Generated Response"),
-    title="roleplay Chatbot"
 )
 if __name__ == "__main__":

 model_name_or_path = "ClosedCharacter/Peach-9B-8k-Roleplay"
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
+# Check if GPU is available
+if torch.cuda.is_available():
+    device = torch.device("cuda")
+else:
+    device = torch.device("cpu")
+    print("GPU not available, using CPU.")
+model = AutoModelForCausalLM.from_pretrained(
+    model_name_or_path, torch_dtype=torch.bfloat16,
+    trust_remote_code=True).to(device)
 def slow_echo(system_message, user_message):
     try:
         messages = [
             {"role": "user", "content": user_message},
         ]
+        input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, return_tensors="pt").to(device)
         output = model.generate(
+            inputs=input_ids,
             do_sample=True,
             temperature=0.3,
             top_p=0.5,
         gr.Textbox(label="User Message")
     ],
     outputs=gr.Textbox(label="Generated Response"),
+    title="Roleplay Chatbot"
 )
 if __name__ == "__main__":

bak2.txt ADDED Viewed

	@@ -0,0 +1,71 @@

+import gradio as gr
+from huggingface_hub import InferenceClient
+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import time
+import traceback
+model_name_or_path = "ClosedCharacter/Peach-9B-8k-Roleplay"
+tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name_or_path, torch_dtype=torch.bfloat16,
+    trust_remote_code=True)
+"""
+messages = [
+    {"role": "system", "content": "你是黑丝御姐"},
+    {"role": "user", "content": "你好，你是谁"},
+]
+input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, return_tensors="pt")
+output = model.generate(
+    inputs=input_ids.to("cpu"),
+    do_sample=True,
+    temperature=0.3,
+    top_p=0.5,
+    no_repeat_ngram_size=6,
+    repetition_penalty=1.1,
+    max_new_tokens=512)
+generated_response = tokenizer.decode(output[0])
+print("Generated response:", generated_response)
+print("First response to 'hi user first':", "你好，我是你的黑丝御姐？")
+"""
+def slow_echo(system_message, user_message):
+    try:
+        messages = [
+            {"role": "system", "content": system_message},
+            {"role": "user", "content": user_message},
+        ]
+        input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, return_tensors="pt")
+        output = model.generate(
+            inputs=input_ids.to("cpu"),
+            do_sample=True,
+            temperature=0.3,
+            top_p=0.5,
+            no_repeat_ngram_size=6,
+            repetition_penalty=1.1,
+            max_new_tokens=512)
+        generated_response = tokenizer.decode(output[0])
+        for i in range(len(generated_response)):
+            time.sleep(0.05)
+            yield generated_response[: i + 1]
+    except Exception as e:
+        error_message = f"An error occurred: {str(e)}\n\nTraceback:\n{traceback.format_exc()}"
+        yield error_message
+iface = gr.Interface(
+    fn=slow_echo,
+    inputs=[
+        gr.Textbox(label="System Message"),
+        gr.Textbox(label="User Message")
+    ],
+    outputs=gr.Textbox(label="Generated Response"),
+    title="roleplay Chatbot"
+)
+if __name__ == "__main__":
+    iface.launch()