Spaces:

kaxap
/

r-jokes-multilingual-e5-large

Runtime error

kaxap commited on Jul 28, 2023

Commit

dfea597

1 Parent(s): 233cc1d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,6 +10,12 @@ from transformers import AutoTokenizer, AutoModel
 from sklearn.metrics.pairwise import cosine_similarity
 df = pd.read_csv('rjokes.csv')
 data_embeddings = np.load("rjokes-embeddings.npy")
@@ -43,7 +49,7 @@ with gr.Blocks() as demo:
         # Get corresponding 'text' for top k similar points
         top_k_text = df['text'].iloc[top_k_idx].tolist()
-        chat_history.extend(f"{i+1}. {top_k_text[i]}" for i in range(len(top_k_text))))
         return "", chat_history
     msg.submit(respond, [msg, chatbot], [msg, chatbot])

 from sklearn.metrics.pairwise import cosine_similarity
+def average_pool(last_hidden_states: Tensor,
+                 attention_mask: Tensor) -> Tensor:
+    last_hidden = last_hidden_states.masked_fill(~attention_mask[..., None].bool(), 0.0)
+    return last_hidden.sum(dim=1) / attention_mask.sum(dim=1)[..., None]
 df = pd.read_csv('rjokes.csv')
 data_embeddings = np.load("rjokes-embeddings.npy")
         # Get corresponding 'text' for top k similar points
         top_k_text = df['text'].iloc[top_k_idx].tolist()
+        chat_history.extend([f"{i+1}. {top_k_text[i]}" for i in range(len(top_k_text))])
         return "", chat_history
     msg.submit(respond, [msg, chatbot], [msg, chatbot])