Arxiv-CS-RAG

Sleeping

bishmoy commited on Mar 4, 2024

Commit

41127cc

verified ·

1 Parent(s): b9e1d94

modified example, added rate limit warning

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,6 +8,7 @@ from datetime import datetime
 import json
 retrieve_results = 10
 generate_kwargs = dict(
     temperature = None,
@@ -38,10 +39,14 @@ try:
 except:
   pass
-with open("sample_outputs.json", "r") as f:
-  sample_outputs = json.load(f)
-output_placeholder = sample_outputs['output_placeholder']
-md_text_initial = sample_outputs['search_placeholder']
 def rag_cleaner(inp):
@@ -106,7 +111,11 @@ with gr.Blocks(theme = gr.themes.Soft()) as demo:
        client = InferenceClient(llm_model_picked)
        #output = client.text_generation(prompt, **generate_kwargs,  stream=False, details=False, return_full_text=False)
-       stream = client.text_generation(prompt, **generate_kwargs,  stream=True, details=True, return_full_text=False)
        #output = output.lstrip(' \n') if output.lstrip().startswith('\n') else output

 import json
 retrieve_results = 10
+show_examples = False
 generate_kwargs = dict(
     temperature = None,
 except:
   pass
+if show_examples:
+    with open("sample_outputs.json", "r") as f:
+      sample_outputs = json.load(f)
+    output_placeholder = sample_outputs['output_placeholder']
+    md_text_initial = sample_outputs['search_placeholder']
+else:
+    output_placeholder = None
+    md_text_initial = ''
 def rag_cleaner(inp):
        client = InferenceClient(llm_model_picked)
        #output = client.text_generation(prompt, **generate_kwargs,  stream=False, details=False, return_full_text=False)
+       try:
+           stream = client.text_generation(prompt, **generate_kwargs,  stream=True, details=True, return_full_text=False)
+       except:
+           gr.Warning("LLM Inference rate limit reached, try again later!")
+           return ""
        #output = output.lstrip(' \n') if output.lstrip().startswith('\n') else output