Spaces:

teragron
/

llama_tokenizer

Runtime error

teragron commited on Oct 8, 2023

Commit

04a6c29

1 Parent(s): 22e320d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,25 +1,34 @@
 import gradio as gr
 from transformers import LlamaTokenizer
 # Load the tokenizer from the specific folder
 tokenizer = LlamaTokenizer.from_pretrained("llama_tokenizer")
-def tokenize(prompt):
-    tokens = tokenizer.encode(prompt, add_special_tokens=False)
     num_tokens = len(tokens)
     return num_tokens
 with gr.Blocks() as demo:
     gr.Markdown(
     """
     # Token Counter for LLAMA
     """)
     with gr.Row():
-        inp = gr.Textbox(placeholder="Enter prompt")
         with gr.Column():
             out = gr.Textbox(label="Number of tokens")
             btn = gr.Button("Run")
-    btn.click(fn=tokenize, inputs=inp, outputs=out)
-demo.launch()

 import gradio as gr
 from transformers import LlamaTokenizer
+import json
 # Load the tokenizer from the specific folder
 tokenizer = LlamaTokenizer.from_pretrained("llama_tokenizer")
+def tokenize(input_text):
+    tokens = tokenizer.encode(input_text, add_special_tokens=False)
     num_tokens = len(tokens)
     return num_tokens
+def count_tokens_from_file(file_path):
+    try:
+        with open(file_path, 'r') as file:
+            input_text = file.read()
+            num_tokens = tokenize(input_text)
+            return num_tokens
+    except Exception as e:
+        return str(e)
 with gr.Blocks() as demo:
     gr.Markdown(
     """
     # Token Counter for LLAMA
     """)
     with gr.Row():
+        inp = gr.Textbox(placeholder="Enter prompt or file path")
         with gr.Column():
             out = gr.Textbox(label="Number of tokens")
             btn = gr.Button("Run")
+    btn.click(fn=count_tokens_from_file, inputs=inp, outputs=out)
+demo.launch()