Isotonic
/

Dolphin-5.1-7b

Text Generation

cognitivecomputations/dolphin-2.6-mistral-7b-dpo-laser

teknium/OpenHermes-2.5-Mistral-7B

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Isotonic commited on Jan 16

Commit

6e9f3f0

•

1 Parent(s): d539f75

Update README.md

Files changed (1) hide show

README.md +4 -3

README.md CHANGED Viewed

@@ -38,13 +38,13 @@ dtype: bfloat16
 ## 💻 Usage
 ```python
-!pip install -qU transformers accelerate
 from transformers import AutoTokenizer
 import transformers
 import torch
-model = "Isotonic/ohmistral-7b-ensemble"
 messages = [{"role": "user", "content": "What is a large language model?"}]
 tokenizer = AutoTokenizer.from_pretrained(model)
@@ -54,8 +54,9 @@ pipeline = transformers.pipeline(
     model=model,
     torch_dtype=torch.float16,
     device_map="auto",
 )
-outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
 print(outputs[0]["generated_text"])
 ```

 ## 💻 Usage
 ```python
+!pip install -qU transformers accelerate eniops
 from transformers import AutoTokenizer
 import transformers
 import torch
+model = "Isotonic/ohmistral-7b-5.1"
 messages = [{"role": "user", "content": "What is a large language model?"}]
 tokenizer = AutoTokenizer.from_pretrained(model)
     model=model,
     torch_dtype=torch.float16,
     device_map="auto",
+    trust_remote_code=True
 )
+outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.8, top_k=80, top_p=0.95)
 print(outputs[0]["generated_text"])
 ```