Add SetFit model
Browse files- README.md +35 -25
- config.json +1 -1
- config_setfit.json +3 -3
- model.safetensors +1 -1
- model_head.pkl +1 -1
- special_tokens_map.json +6 -42
README.md
CHANGED
@@ -57,7 +57,7 @@ model-index:
|
|
57 |
split: test
|
58 |
metrics:
|
59 |
- type: accuracy
|
60 |
-
value: 0.
|
61 |
name: Accuracy
|
62 |
---
|
63 |
|
@@ -89,20 +89,20 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
89 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
90 |
|
91 |
### Model Labels
|
92 |
-
| Label | Examples
|
93 |
-
|
94 |
-
|
|
95 |
-
|
|
96 |
-
| Sport | <ul><li>'
|
97 |
-
| Pomoc | <ul><li>'
|
98 |
-
|
|
99 |
|
100 |
## Evaluation
|
101 |
|
102 |
### Metrics
|
103 |
| Label | Accuracy |
|
104 |
|:--------|:---------|
|
105 |
-
| **all** | 0.
|
106 |
|
107 |
## Uses
|
108 |
|
@@ -154,15 +154,15 @@ preds = model("Organizacja \"Sport dla Wszystkich\" poszukuje wolontariuszy do p
|
|
154 |
### Training Set Metrics
|
155 |
| Training set | Min | Median | Max |
|
156 |
|:-------------|:----|:--------|:----|
|
157 |
-
| Word count |
|
158 |
|
159 |
| Label | Training Sample Count |
|
160 |
|:---------|:----------------------|
|
161 |
-
|
|
162 |
-
|
|
163 |
-
|
|
164 |
-
|
|
165 |
-
|
|
166 |
|
167 |
### Training Hyperparameters
|
168 |
- batch_size: (8, 8)
|
@@ -185,20 +185,30 @@ preds = model("Organizacja \"Sport dla Wszystkich\" poszukuje wolontariuszy do p
|
|
185 |
### Training Results
|
186 |
| Epoch | Step | Training Loss | Validation Loss |
|
187 |
|:------:|:----:|:-------------:|:---------------:|
|
188 |
-
| 0.
|
189 |
-
| 0.
|
190 |
-
| 0.
|
191 |
-
| 0.
|
192 |
-
| 0.
|
193 |
-
| 0.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
194 |
|
195 |
### Framework Versions
|
196 |
-
- Python: 3.10.
|
197 |
- SetFit: 1.0.3
|
198 |
- Sentence Transformers: 2.3.1
|
199 |
-
- Transformers: 4.
|
200 |
-
- PyTorch: 2.1.0+
|
201 |
-
- Datasets: 2.
|
202 |
- Tokenizers: 0.15.1
|
203 |
|
204 |
## Citation
|
|
|
57 |
split: test
|
58 |
metrics:
|
59 |
- type: accuracy
|
60 |
+
value: 0.9
|
61 |
name: Accuracy
|
62 |
---
|
63 |
|
|
|
89 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
90 |
|
91 |
### Model Labels
|
92 |
+
| Label | Examples |
|
93 |
+
|:---------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
94 |
+
| Kultura | <ul><li>'Dołącz do naszej rodziny teatru społecznościowego! Poszukujemy pasjonatów, którzy chcą pomóc w kreowaniu fascynujących przedstawień i dotrzeć do naszej publiczności na głębszym poziomie.'</li><li>'The "Creative Minds Foundation" is seeking volunteers for its "Artistic Explorers" project. The initiative aims to bring art and culture to local communities through interactive workshops and exhibitions. We are looking for individuals with a passion for the arts, excellent communication skills, and a willingness to inspire creativity. Volunteers will be responsible for organizing art sessions, assisting in exhibitions, and fostering a love for artistic expression in the community.'</li><li>'Przyłącz się do naszego zespołu jako wolontariusz w projekcie dokumentalnym. Tworzymy historię i chcielibyśmy, abyś pomógł nam uwiecznić ją na taśmie. To okazja do wyrażenia siebie i wpisania swojego śladu w historii kultury.'</li></ul> |
|
95 |
+
| Ekologia | <ul><li>'Chcielibyśmy, abyś dołączył jako wolontariusz do naszego projektu badawczego nad zachowaniem dzikich pszczół. Wymagamy od kandydatów zainteresowania tematyką pszczół, zdolności do zbierania danych terenowych oraz umiejętności komunikacji zespołowej. Jako wolontariusz będziesz miał okazję uczestniczyć w badaniach terenowych, poznawania tajemnic pszczelich społeczności i dowiadywania się, jak możemy chronić ich środowisko. Twoja praca przyczyni się do zrozumienia i ochrony tych cennych zapylaczy, które są kluczowe dla naszej globalnej żywności. Razem możemy działać na rzecz ich przetrwania i zachowania.'</li><li>'Stowarzyszenie "EkoEdukacja" poszukuje wolontariuszy do projektu "Mistrzowie Recyklingu". Inicjatywa ta ma na celu edukację i wsparcie społeczności lokalnej w zakresie zrównoważonego gospodarowania odpadami. Wolonatriusze będą rejestrowac chętnych uczestników projektu.'</li><li>'Dołącz do nas jako wolontariusz ds. edukacji ekologicznej i staniesz się źródłem inspiracji dla innych. Twój wkład w prowadzenie warsztatów i prelekcji będzie promować zrównoważony tryb życia i ochronę przyrody.'</li></ul> |
|
96 |
+
| Sport | <ul><li>'Dołącz do nas jako wolontariusz na zajęciach fitness w parku. Pomagajmy naszym mieszkańcom w utrzymaniu zdrowia i kondycji fizycznej, organizując treningi dostępne dla wszystkich.'</li><li>'Dołącz do nas jako wolontariusz w projekcie dla młodzieży, który ma na celu promowanie aktywności fizycznej na świeżym powietrzu. Razem będziemy kształtować programy zajęć, organizować wyprawy i tworzyć przestrzenie, które inspirują młodych ludzi do aktywnego życia.'</li><li>'Dołącz do naszej drużyny wolontariuszy, którzy wspierają organizację lokalnych wydarzeń sportowych! Jako wolontariusz będziesz odpowiedzialny za przyjmowanie zgłoszeń, rejestrację uczestników, kontrolę dostępu, zarządzanie stanowiskami informacyjnymi i pomoc w zabezpieczeniach medycznych.'</li></ul> |
|
97 |
+
| Pomoc | <ul><li>'Chcielibyśmy, abyś dołączył jako wolontariusz do programu wsparcia rodzin z dziećmi w trudnej sytuacji życiowej. Twój zakres obowiązków obejmuje pomoc w rozwiązywaniu konfliktów, udzielanie wsparcia w procesie resocjalizacji i tworzenie bezpiecznego otoczenia dla dzieci.'</li><li>'Poszukujemy wolontariuszy do pracy w schroniskach dla bezdomnych zwierząt. Twój udział polega na opiece nad zwierzętami, ich karmieniu, czyszczeniu klatek oraz organizowaniu adopcji.'</li><li>'Łączy nas wspólna idea aktywizacji osób niepełnosprawnych. Zarażamy pasją do pomagania, a każdy z nas ma w sobie super moc, którą dzieli się z innymi! \n\nChcesz aktywnie działać na rzecz osób niepełnosprawnych? Weź udział w Warsztacie Aktywnej Rehabilitacji! Wpadnij na nasze co miesięczne zajęcia sportowe dla dzieci lub dorosłych! \n\nChcesz wiedzieć więcej?\n\nZapraszamy Cię ciepło do naszego Biura Regionalnego przy ul. Kubusia Puchatka 4 w Gdańsku. Wypijemy wspólnie kawę i opowiemy Ci jak działamy. Gwarantujemy mnóstwo pozytywnej energii! \n\nNie czekaj na impuls… Działaj z nami! Ostrzegamy… to uzależnia :)'</li></ul> |
|
98 |
+
| Edukacja | <ul><li>'Chcielibyśmy, abyś dołączył jako wolontariusz do projektu wspierania osób w nauce i rozwoju osobistym. Wymagamy od kandydatów cierpliwości, empatii oraz umiejętności słuchania. Jako wolontariusz będziesz miał/mogła okazję udzielać pomocy w nauce, rozmawiać z osobami potrzebującymi wsparcia i inspirować je do osiągania celów. Twoja praca może pomóc wielu ludziom w pokonywaniu trudności i rozwijaniu swojego potencjału.'</li><li>'Dołącz do nas jako wolontariusz ds. edukacji cyfrowej i stań się przewodnikiem w świecie nowoczesnych technologii. Wymagamy od kandydatów umiejętności obsługi komputera, chęci do uczenia innych oraz zdolności do tworzenia treści edukacyjnych. Jako wolontariusz będziesz miał/mogła okazję prowadzić szkolenia z zakresu obsługi komputera, korzystania z internetu czy tworzenia stron internetowych. Razem możemy pomóc innym w zdobywaniu cyfrowej kompetencji i rozwijaniu się w erze technologicznej.'</li><li>'Dołącz do nas jako wolontariusz ds. edukacji zdrowotnej i razem z nami propaguj zdrowy styl życia. Wymagamy od kandydatów zainteresowania tematyką zdrowia, umiejętności prowadzenia prelekcji oraz chęci do promowania świadomych wyborów. Jako wolontariusz będziesz miał/mogła okazję prowadzić warsztaty dotyczące zdrowego odżywiania, aktywności fizycznej i profilaktyki zdrowotnej. Razem możemy pomóc innym prowadzić zdrowszy tryb życia.'</li></ul> |
|
99 |
|
100 |
## Evaluation
|
101 |
|
102 |
### Metrics
|
103 |
| Label | Accuracy |
|
104 |
|:--------|:---------|
|
105 |
+
| **all** | 0.9 |
|
106 |
|
107 |
## Uses
|
108 |
|
|
|
154 |
### Training Set Metrics
|
155 |
| Training set | Min | Median | Max |
|
156 |
|:-------------|:----|:--------|:----|
|
157 |
+
| Word count | 19 | 46.8618 | 177 |
|
158 |
|
159 |
| Label | Training Sample Count |
|
160 |
|:---------|:----------------------|
|
161 |
+
| Edukacja | 29 |
|
162 |
+
| Ekologia | 36 |
|
163 |
+
| Kultura | 25 |
|
164 |
+
| Pomoc | 31 |
|
165 |
+
| Sport | 31 |
|
166 |
|
167 |
### Training Hyperparameters
|
168 |
- batch_size: (8, 8)
|
|
|
185 |
### Training Results
|
186 |
| Epoch | Step | Training Loss | Validation Loss |
|
187 |
|:------:|:----:|:-------------:|:---------------:|
|
188 |
+
| 0.0013 | 1 | 0.1682 | - |
|
189 |
+
| 0.0658 | 50 | 0.0664 | - |
|
190 |
+
| 0.1316 | 100 | 0.0306 | - |
|
191 |
+
| 0.1974 | 150 | 0.004 | - |
|
192 |
+
| 0.2632 | 200 | 0.0169 | - |
|
193 |
+
| 0.3289 | 250 | 0.0017 | - |
|
194 |
+
| 0.3947 | 300 | 0.0009 | - |
|
195 |
+
| 0.4605 | 350 | 0.001 | - |
|
196 |
+
| 0.5263 | 400 | 0.0007 | - |
|
197 |
+
| 0.5921 | 450 | 0.0004 | - |
|
198 |
+
| 0.6579 | 500 | 0.0008 | - |
|
199 |
+
| 0.7237 | 550 | 0.0003 | - |
|
200 |
+
| 0.7895 | 600 | 0.0002 | - |
|
201 |
+
| 0.8553 | 650 | 0.0002 | - |
|
202 |
+
| 0.9211 | 700 | 0.0006 | - |
|
203 |
+
| 0.9868 | 750 | 0.0007 | - |
|
204 |
|
205 |
### Framework Versions
|
206 |
+
- Python: 3.10.12
|
207 |
- SetFit: 1.0.3
|
208 |
- Sentence Transformers: 2.3.1
|
209 |
+
- Transformers: 4.35.2
|
210 |
+
- PyTorch: 2.1.0+cu121
|
211 |
+
- Datasets: 2.17.0
|
212 |
- Tokenizers: 0.15.1
|
213 |
|
214 |
## Citation
|
config.json
CHANGED
@@ -19,7 +19,7 @@
|
|
19 |
"pad_token_id": 0,
|
20 |
"position_embedding_type": "absolute",
|
21 |
"torch_dtype": "float32",
|
22 |
-
"transformers_version": "4.
|
23 |
"type_vocab_size": 2,
|
24 |
"use_cache": true,
|
25 |
"vocab_size": 250037
|
|
|
19 |
"pad_token_id": 0,
|
20 |
"position_embedding_type": "absolute",
|
21 |
"torch_dtype": "float32",
|
22 |
+
"transformers_version": "4.35.2",
|
23 |
"type_vocab_size": 2,
|
24 |
"use_cache": true,
|
25 |
"vocab_size": 250037
|
config_setfit.json
CHANGED
@@ -1,10 +1,10 @@
|
|
1 |
{
|
2 |
"normalize_embeddings": false,
|
3 |
"labels": [
|
4 |
-
"Kultura",
|
5 |
-
"Sport",
|
6 |
"Edukacja",
|
7 |
"Ekologia",
|
8 |
-
"
|
|
|
|
|
9 |
]
|
10 |
}
|
|
|
1 |
{
|
2 |
"normalize_embeddings": false,
|
3 |
"labels": [
|
|
|
|
|
4 |
"Edukacja",
|
5 |
"Ekologia",
|
6 |
+
"Kultura",
|
7 |
+
"Pomoc",
|
8 |
+
"Sport"
|
9 |
]
|
10 |
}
|
model.safetensors
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
size 470637416
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:9ebbb640028b2357393e02a84bcf2b8e94aef0d7b473d6229ce7ce7647c5117f
|
3 |
size 470637416
|
model_head.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
size 16383
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:5911816e2f958121063108e656f11274276c523dfc4a4fa9a58aa44ef712c9df
|
3 |
size 16383
|
special_tokens_map.json
CHANGED
@@ -1,25 +1,7 @@
|
|
1 |
{
|
2 |
-
"bos_token":
|
3 |
-
|
4 |
-
|
5 |
-
"normalized": false,
|
6 |
-
"rstrip": false,
|
7 |
-
"single_word": false
|
8 |
-
},
|
9 |
-
"cls_token": {
|
10 |
-
"content": "<s>",
|
11 |
-
"lstrip": false,
|
12 |
-
"normalized": false,
|
13 |
-
"rstrip": false,
|
14 |
-
"single_word": false
|
15 |
-
},
|
16 |
-
"eos_token": {
|
17 |
-
"content": "</s>",
|
18 |
-
"lstrip": false,
|
19 |
-
"normalized": false,
|
20 |
-
"rstrip": false,
|
21 |
-
"single_word": false
|
22 |
-
},
|
23 |
"mask_token": {
|
24 |
"content": "<mask>",
|
25 |
"lstrip": true,
|
@@ -27,25 +9,7 @@
|
|
27 |
"rstrip": false,
|
28 |
"single_word": false
|
29 |
},
|
30 |
-
"pad_token":
|
31 |
-
|
32 |
-
|
33 |
-
"normalized": false,
|
34 |
-
"rstrip": false,
|
35 |
-
"single_word": false
|
36 |
-
},
|
37 |
-
"sep_token": {
|
38 |
-
"content": "</s>",
|
39 |
-
"lstrip": false,
|
40 |
-
"normalized": false,
|
41 |
-
"rstrip": false,
|
42 |
-
"single_word": false
|
43 |
-
},
|
44 |
-
"unk_token": {
|
45 |
-
"content": "<unk>",
|
46 |
-
"lstrip": false,
|
47 |
-
"normalized": false,
|
48 |
-
"rstrip": false,
|
49 |
-
"single_word": false
|
50 |
-
}
|
51 |
}
|
|
|
1 |
{
|
2 |
+
"bos_token": "<s>",
|
3 |
+
"cls_token": "<s>",
|
4 |
+
"eos_token": "</s>",
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
"mask_token": {
|
6 |
"content": "<mask>",
|
7 |
"lstrip": true,
|
|
|
9 |
"rstrip": false,
|
10 |
"single_word": false
|
11 |
},
|
12 |
+
"pad_token": "<pad>",
|
13 |
+
"sep_token": "</s>",
|
14 |
+
"unk_token": "<unk>"
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
}
|