aiplanet
/

effi-7b-awq

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

bhavyaaiplanet commited on Feb 10, 2024

Commit

ee98521

·

verified ·

1 Parent(s): 1ff7374

Update README.md

Files changed (1) hide show

README.md +7 -7

README.md CHANGED Viewed

@@ -30,11 +30,11 @@ effi 7b AWQ is a quantized version of effi 7b whiich is a 7 billion parameter mo
 ### Qunatization Configuration
-- zero_point: true
-- q_group_size: 128
-- w_bit: 4
-- version: "GEMM"
-- modules_to_not_convert: null
@@ -77,8 +77,8 @@ print(f"{tokenizer.batch_decode(outputs.detach().cpu().numpy(), skip_special_tok
 ```
 ### Framework versions
-- Transformers 4.37.2
-- Autoawq 0.1.8
 ### Citation

 ### Qunatization Configuration
+- **zero_point:** true
+- **q_group_size:** 128
+- **w_bit:** 4
+- **version:** "GEMM"
+- **modules_to_not_convert:** null
 ```
 ### Framework versions
+- **Transformers** 4.37.2
+- **Autoawq** 0.1.8
 ### Citation