urdu-llama

Runtime error

traversaal-ai commited on Oct 12

Commit

2c99f68

•

1 Parent(s): a6b011a

Update run.py

Files changed (1) hide show

run.py CHANGED Viewed

@@ -15,8 +15,7 @@ from unsloth import FastLanguageModel
 import torch
-max_seq_length = 2048 # Choose any! We auto support RoPE Scaling internally!
-dtype = None # None for auto detection. Float16 for Tesla T4, V100, Bfloat16 for Ampere+
 load_in_4bit = True # Use 4bit quantization to reduce memory usage. Can be False.
@@ -32,7 +31,7 @@ from unsloth import FastLanguageModel
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name = "traversaal-llm-regional-languages/Unsloth_Urdu_Llama3_1_4bit_PF100",
     max_seq_length = max_seq_length,
-    dtype = dtype,
     load_in_4bit = load_in_4bit
 )
 FastLanguageModel.for_inference(model)

 import torch
+max_seq_length = 2048 # Choose any! We auto support RoPE Scaling internally! # None for auto detection. Float16 for Tesla T4, V100, Bfloat16 for Ampere+
 load_in_4bit = True # Use 4bit quantization to reduce memory usage. Can be False.
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name = "traversaal-llm-regional-languages/Unsloth_Urdu_Llama3_1_4bit_PF100",
     max_seq_length = max_seq_length,
+    dtype = 'Auto',
     load_in_4bit = load_in_4bit
 )
 FastLanguageModel.for_inference(model)