RedXeol
/

bertin-gpt-j-6B-alpaca-4bit-128g

Text Generation

bertin-project/alpaca-spanish

Inference Endpoints

Model card Files Files and versions Community

RedXeol commited on May 12, 2023

Commit

a752833

·

1 Parent(s): a93743e

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -68,6 +68,8 @@ This dataset cannot be used to create models that compete in any way with OpenAI
 Finetuning
 To fine-tune the BERTIN GPT-J-6B model we used the code available on BERTIN's fork of mesh-transformer-jax, which provides code adapt an Alpaca dataset to finetune any GPT-J-6B model. We run finetuning for 3 epochs using sequence length of 2048 on a single TPUv3-8 for 3 hours on top of BERTIN GPT-J-6B.
 **Español** 🇪🇸
@@ -117,7 +119,7 @@ Este conjunto de datos no se puede usar para crear modelos que compitan de algun
 Finetuning
 Para ajustar el modelo BERTIN GPT-J-6B, usamos el código disponible en la bifurcación de BERTIN de mesh-transformer-jax, que proporciona código para adaptar un conjunto de datos de Alpaca para ajustar cualquier modelo GPT-J-6B. Ejecutamos un ajuste fino para 3 épocas usando una longitud de secuencia de 2048 en un solo TPUv3-8 durante 3 horas sobre BERTIN GPT-J-6B.
-necesitas una gpu de 8GB para ejecutarlocorrectamente.
 **puebas en nvidia rtx 3060 (12GB)**

 Finetuning
 To fine-tune the BERTIN GPT-J-6B model we used the code available on BERTIN's fork of mesh-transformer-jax, which provides code adapt an Alpaca dataset to finetune any GPT-J-6B model. We run finetuning for 3 epochs using sequence length of 2048 on a single TPUv3-8 for 3 hours on top of BERTIN GPT-J-6B.
+**you need an 8GB gpu to run it correctly.**
 **Español** 🇪🇸
 Finetuning
 Para ajustar el modelo BERTIN GPT-J-6B, usamos el código disponible en la bifurcación de BERTIN de mesh-transformer-jax, que proporciona código para adaptar un conjunto de datos de Alpaca para ajustar cualquier modelo GPT-J-6B. Ejecutamos un ajuste fino para 3 épocas usando una longitud de secuencia de 2048 en un solo TPUv3-8 durante 3 horas sobre BERTIN GPT-J-6B.
+**necesitas una gpu de 8GB para ejecutarlo correctamente.**
 **puebas en nvidia rtx 3060 (12GB)**