Sdff-Ltba
/

LightChatAssistant-2x7B-GGUF

Text Generation

Mixture of Experts

Not-For-All-Audiences

nsfw

Inference Endpoints

Model card Files Files and versions Community

Sdff-Ltba commited on Apr 5, 2024

Commit

757966a

·

verified ·

1 Parent(s): aa7362b

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -12,11 +12,12 @@ pipeline_tag: text-generation
 # LightChatAssistant-2x7B-GGUF
 [Sdff-Ltba/LightChatAssistant-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-2x7B)をGGUF変換したものです。
-iMatrixを併用して量子化しています。
 ## 量子化手順
-以下の通りに実行しました。
 ```
 python ./llama.cpp/convert.py ./LightChatAssistant-2x7B --outtype f16 --outfile ./gguf-model_f16.gguf
 ./llama.cpp/imatrix -m ./gguf-model_f16.gguf -f ./wiki.train.raw -o ./gguf-model_f16.imatrix --chunks 32

 # LightChatAssistant-2x7B-GGUF
 [Sdff-Ltba/LightChatAssistant-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-2x7B)をGGUF変換したものです。
+iQ3_XXSはiMatrixを併用して量子化しています。(それ以外はiMatrix非適用です)
+※製作者は本モデルを使うときはiQ3_XXSを使用しています。
 ## 量子化手順
+以下の通りに実行しました。(iMatrixを併用してiQ3_XXSにする場合)
 ```
 python ./llama.cpp/convert.py ./LightChatAssistant-2x7B --outtype f16 --outfile ./gguf-model_f16.gguf
 ./llama.cpp/imatrix -m ./gguf-model_f16.gguf -f ./wiki.train.raw -o ./gguf-model_f16.imatrix --chunks 32