MiniChat-1.5-3B-Sorah

Sorah

Requisitos

Para usar este modelo, necesitas tener instalado llama.cpp en tu equipo. Puedes obtener llama.cpp desde el siguiente repositorio:

Para instalar llama.cpp, sigue estos pasos:

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make

Uso del modelo

La plantilla del modelo es la siguiente:

GPT4 Correct User: {prompt} <|end_of_turn|>GPT4 Correct Assistant:

Puedes utilizar el modelo en llama.cpp con el siguiente comando:

./main -m ggml-model-Q8_0.gguf -p "GPT4 Correct User: Hola, ¿cómo te llamas? <|end_of_turn|>GPT4 Correct Assistant:" --log-disable

LM Studio config-presets

Filename:openchat.preset.json

{
  "name": "OpenChat",
  "inference_params": {
    "input_prefix": "GPT4 Correct User:",
    "input_suffix": "<|end_of_turn|>GPT4 Correct Assistant:",
    "antiprompt": [
      "GPT4 Correct User:",
      "<|end_of_turn|>GPT4 Correct Assistant:"
    ],
    "pre_prompt": "",
    "pre_prompt_prefix": "",
    "pre_prompt_suffix": ""
  },
  "load_params": {
    "rope_freq_scale": 0,
    "rope_freq_base": 0
  }
}

Referencias

Downloads last month
56
GGUF
Model size
7.24B params
Architecture
llama

2-bit

3-bit

4-bit

5-bit

6-bit

8-bit

16-bit

32-bit

Inference API
Unable to determine this model's library. Check the docs .

Collection including HirCoir/openchat-3.5-0106-GGUF