Barcenas 3b GRPO ES

Basado en el alpindale/Llama-3.2-3B-Instruct

Y entrenado con datos en español de Danielbrdz/gsm8k-ES

El objetivo de este LLM es usar el tipo de entrenamiento GRPO con datos 100% en español.

Tener un modelo pequeño que razone en español y que puede ejecutarse en la mayoría de computadoras.


Barcenas 3b GRPO ES

Based on alpindale/Llama-3.2-3B-Instruct

And trained with Spanish data from Danielbrdz/gsm8k-ES

The goal of this LLM is to use the GRPO training type with 100% Spanish data.

To have a small model that reasons in Spanish and that can be run on most computers.

Made with ❤️ in Guadalupe, Nuevo Leon, Mexico 🇲🇽

Downloads last month
15
Safetensors
Model size
3.21B params
Tensor type
FP16
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for Danielbrdz/Barcenas-3b-GRPO-ES

Finetuned
(269)
this model
Quantizations
1 model

Dataset used to train Danielbrdz/Barcenas-3b-GRPO-ES