Spaces:

samunder12
/

hellome

Sleeping

samunder12 commited on Jun 29, 2024

Commit

eda1383

verified ·

1 Parent(s): 64f07e3

hello again

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,9 +1,11 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
-client = InferenceClient("facebook/opt-350m")
-def respond(
     message,
     history: list[tuple[str, str]],
     system_message,
@@ -17,30 +19,35 @@ def respond(
         prompt += f"Human: {user_msg}\nAI: {bot_msg}\n"
     prompt += f"Human: {message}\nAI:"
-    # Generate response
-    response = client.text_generation(
-        prompt,
-        max_new_tokens=max_tokens,
-        temperature=temperature,
-        top_p=top_p,
-        do_sample=True,
-    )
-    # Extract only the AI's response
-    ai_response = response.split("AI:")[-1].strip()
-    return ai_response
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Textbox(value="You are a helpful AI assistant.", label="System message"),
-        gr.Slider(minimum=1, maximum=256, value=128, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=2.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
-            value=0.95,
             step=0.05,
             label="Top-p (nucleus sampling)",
         ),

 import gradio as gr
 from huggingface_hub import InferenceClient
+import asyncio
+# Use a smaller model
+client = InferenceClient("distilgpt2")
+async def respond(
     message,
     history: list[tuple[str, str]],
     system_message,
         prompt += f"Human: {user_msg}\nAI: {bot_msg}\n"
     prompt += f"Human: {message}\nAI:"
+    try:
+        # Generate response with a timeout
+        response = await asyncio.wait_for(
+            client.text_generation(
+                prompt,
+                max_new_tokens=max_tokens,
+                temperature=temperature,
+                top_p=top_p,
+                do_sample=True,
+            ),
+            timeout=10  # 10 seconds timeout
+        )
+        # Extract only the AI's response
+        ai_response = response.split("AI:")[-1].strip()
+        return ai_response
+    except asyncio.TimeoutError:
+        return "I'm sorry, but I'm having trouble generating a response right now. Could you try again?"
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Textbox(value="You are a helpful AI assistant.", label="System message"),
+        gr.Slider(minimum=1, maximum=100, value=50, step=1, label="Max new tokens"),
+        gr.Slider(minimum=0.1, maximum=1.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
+            value=0.9,
             step=0.05,
             label="Top-p (nucleus sampling)",
         ),