RedXeol commited on
Commit
a7c5062
1 Parent(s): 22a497b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -2
README.md CHANGED
@@ -105,5 +105,6 @@ Este conjunto de datos no se puede usar para crear modelos que compitan de algun
105
  Finetuning
106
  Para ajustar el modelo BERTIN GPT-J-6B, usamos el código disponible en la bifurcación de BERTIN de mesh-transformer-jax, que proporciona código para adaptar un conjunto de datos de Alpaca para ajustar cualquier modelo GPT-J-6B. Ejecutamos un ajuste fino para 3 épocas usando una longitud de secuencia de 2048 en un solo TPUv3-8 durante 3 horas sobre BERTIN GPT-J-6B.
107
 
108
- ![memoria gpu carga](https://twitter.com/IdeVtuber/status/1657081992851120134/photo/1)
109
- ![memoria gpu uso](https://twitter.com/IdeVtuber/status/1657081992851120134/photo/2)
 
 
105
  Finetuning
106
  Para ajustar el modelo BERTIN GPT-J-6B, usamos el código disponible en la bifurcación de BERTIN de mesh-transformer-jax, que proporciona código para adaptar un conjunto de datos de Alpaca para ajustar cualquier modelo GPT-J-6B. Ejecutamos un ajuste fino para 3 épocas usando una longitud de secuencia de 2048 en un solo TPUv3-8 durante 3 horas sobre BERTIN GPT-J-6B.
107
 
108
+ ![memoria gpu carga](https://pbs.twimg.com/media/Fv8jPPWXgAAbAAW?format=png&name=900x900)
109
+
110
+ ![memoria gpu uso](https://pbs.twimg.com/media/Fv8jPPTXgAAPpMy?format=png&name=900x900)