dahara1
/

weblab-10b-instruction-sft-GPTQ

Text Generation

text-generation-inference

Model card Files Files and versions Community

dahara1 commited on Aug 22, 2023

Commit

40f8719

•

1 Parent(s): 3849685

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -8,12 +8,12 @@ Benchmark results are in progress.
 I will upload it at a later date.
-sample code
-'''
 pip install auto-gptq
-'''
-'''
 from transformers import AutoTokenizer
 from auto_gptq import AutoGPTQForCausalLM
@@ -34,7 +34,7 @@ prompt_template = f"### Instruction: {prompt}\n### Response:"
 tokens = tokenizer(prompt_template, return_tensors="pt").to("cuda:0").input_ids
 output = model.generate(input_ids=tokens, max_new_tokens=100, do_sample=True, temperature=0.8)
 print(tokenizer.decode(output[0]))
-'''
-See Also
 https://github.com/PanQiWei/AutoGPTQ/blob/main/docs/tutorial/01-Quick-Start.md

 I will upload it at a later date.
+### sample code
+```
 pip install auto-gptq
+```
+```
 from transformers import AutoTokenizer
 from auto_gptq import AutoGPTQForCausalLM
 tokens = tokenizer(prompt_template, return_tensors="pt").to("cuda:0").input_ids
 output = model.generate(input_ids=tokens, max_new_tokens=100, do_sample=True, temperature=0.8)
 print(tokenizer.decode(output[0]))
+```
+### See Also
 https://github.com/PanQiWei/AutoGPTQ/blob/main/docs/tutorial/01-Quick-Start.md