mmnga's picture
Update README.md
ef53c40
|
raw
history blame
1.45 kB
metadata
license: apache-2.0

llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0-gguf

llm-jpさんが公開しているllm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0のggufフォーマット変換版です。

注意:こちらはブランチで試用になります。llama.cpp本家にgpt2が実装された時に、このggufファイルが使用できない可能性があります。

GitHubリポジトリの readme はこちら

モデル一覧
GPTQ版
mmnga/llm-jp-13b-v1.0-4bit-g128-GPTQ-calib-ja-1k
mmnga/llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0-GPTQ-calib-ja-1k

GGUF版
mmnga/llm-jp-13b-v1.0-gguf
mmnga/llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0-gguf

Usage

git clone --branch mmnga-dev-merge https://github.com/mmnga/llama.cpp.git
cd llama.cpp
make -j
./main -m 'llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0-q4_0.gguf' -n 128 -p '今日の夕食のレシピを教えて ### 回答:' --top_p 0.9 --temp 0.7 --repeat-penalty 1.2