QuantFactory
/

ArrowPro-7B-KUJIRA-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

munish0838 commited on Jun 4, 2024

Commit

5be0f9b

·

verified ·

1 Parent(s): 6de98f5

Create README.md

Files changed (1) hide show

README.md +74 -0

README.md ADDED Viewed

	@@ -0,0 +1,74 @@

+---
+license: apache-2.0
+pipeline_tag: text-generation
+base_model: DataPilot/ArrowPro-7B-KUJIRA
+---
+# QuantFactory/ArrowPro-7B-KUJIRA-GGUF
+This is quantied version of [DataPilot/ArrowPro-7B-KUJIRA](https://huggingface.co/DataPilot/ArrowPro-7B-KUJIRA) created using llama.cpp
+## Model Description
+ArrowPro-7B-KUJIRAはMistral系のNTQAI/chatntq-ja-7b-v1.0をベースにAItuber、AIアシスタントの魂となるようにChat性能、および高いプロンプトインジェクション耐性を重視して作られました。
+## ベンチマーク
+ArrowPro-7B-KUJIRAはベンチマーク(ELYZA-TASK100)において約3.8(LLaMa3-70B準拠)をマークし、7Bにおいて日本語性能世界一を達成しました。
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/65f01b5235c5424c262c8be8/xwR2f_msM-mJUAbdmlu4v.png)
+## How to use
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("DataPilot/ArrowPro-7B-KUJIRA")
+model = AutoModelForCausalLM.from_pretrained(
+  "DataPilot/ArrowPro-7B-KUJIRA",
+  torch_dtype="auto",
+)
+model.eval()
+if torch.cuda.is_available():
+    model = model.to("cuda")
+def build_prompt(user_query):
+    sys_msg = "あなたは日本語を話す優秀なアシスタントです。回答には必ず日本語で答えてください。"
+    template = """[INST] <<SYS>>
+{}
+<</SYS>>
+{}[/INST]"""
+    return template.format(sys_msg,user_query)
+# Infer with prompt without any additional input
+user_inputs = {
+    "user_query": "まどマギで一番かわいいキャラはだれ？",
+}
+prompt = build_prompt(**user_inputs)
+input_ids = tokenizer.encode(
+    prompt,
+    add_special_tokens=True,
+    return_tensors="pt"
+)
+tokens = model.generate(
+    input_ids.to(device=model.device),
+    max_new_tokens=500,
+    temperature=1,
+    top_p=0.95,
+    do_sample=True,
+)
+out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
+print(out)
+```
+## 謝辞
+助言を与えてくださったすべての皆様に感謝します。
+また、元モデルの開発者の皆様にも感謝を申し上げます。
+## お願い
+このモデルを利用する際は他人に迷惑をかけないように最大限留意してください。