pszemraj
/

mGPT-Peter-2E

@@ -20,7 +20,7 @@ widget:
   example_title: "fashion - Chinese"
 - text: "Wat zei je over mijn moeder? peter szemraj: Ik"
   example_title: "🚎 - Dutch"
-- text: "Mówię bez ust i słyszę bez uszu. Nie mam ciała, ale ożywiam się wraz z wiatrem. Czym jestem? peter szemraj: Czy to"
   example_title: "brain teaser - Polish"
 - text: "Minha amiga diz que conhece todas as línguas, mas não fala nenhuma delas... o que há de errado com ela? peter szemraj: Eu"
   example_title: "language - Portuguese"
@@ -43,7 +43,9 @@ widget:
 - text: "как написать хорошие подсказки для языковых моделей? peter szemraj: ну, во-первых,"
   example_title: "prompt tutorial - Russian"
 - text: "Pewien mężczyzna wpycha swój samochód do hotelu i mówi właścicielowi, że jest bankrutem. Dlaczego? peter szemraj: może"
-  example_title: "brain teaser - Polish"
 inference:
   parameters:
@@ -68,6 +70,11 @@ inference:
 - testing if fine-tuned personality data bleeds over to other languages without being trained in them explicitly
 ### Usage in python
 Install the transformers library if you don't have it:
@@ -107,7 +114,7 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine_with_restarts
 - lr_scheduler_warmup_ratio: 0.05
-- num_epochs: 2
 ### Framework versions

   example_title: "fashion - Chinese"
 - text: "Wat zei je over mijn moeder? peter szemraj: Ik"
   example_title: "🚎 - Dutch"
+- text: "Zagadka: Najpierw mnie zjadasz, a potem sam zostajesz zjedzony. Czym ja jestem? peter szemraj: Czy to"
   example_title: "brain teaser - Polish"
 - text: "Minha amiga diz que conhece todas as línguas, mas não fala nenhuma delas... o que há de errado com ela? peter szemraj: Eu"
   example_title: "language - Portuguese"
 - text: "как написать хорошие подсказки для языковых моделей? peter szemraj: ну, во-первых,"
   example_title: "prompt tutorial - Russian"
 - text: "Pewien mężczyzna wpycha swój samochód do hotelu i mówi właścicielowi, że jest bankrutem. Dlaczego? peter szemraj: może"
+  example_title: "brain teaser - Polish 2"
+- text: "Zagadka: Mówię bez ust i słyszę bez uszu. Nie mam ciała, ale ożywiam się wraz z wiatrem. Czym jestem? peter szemraj: Czy to"
+  example_title: "brain teaser - Polish 3"
 inference:
   parameters:
 - testing if fine-tuned personality data bleeds over to other languages without being trained in them explicitly
+**Interesting findings thus far:**
+- Passing a generic word after the `<name-identifier>` that is in a non-English language helps ensure the model responds in the question language (see: any example).
+- Model generations (in general) remain semantically consistent, even if the generations switch from  `<language>`to English in the middle of the generated text. This demonstrates some sort of "universal concept understanding" .
 ### Usage in python
 Install the transformers library if you don't have it:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine_with_restarts
 - lr_scheduler_warmup_ratio: 0.05
+- num_epochs: 1 (in addition to all training on prior checkpoints)
 ### Framework versions