moonshotai
/

Moonlight-16B-A3B-Instruct

Text Generation

Model card Files Files and versions Community

liushaowei commited on 3 days ago

Commit

b42671f

·

1 Parent(s): 579a3a3

update readme

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -98,14 +98,14 @@ For our pretrained model (Moonlight-16B-A3B):
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-model_path = "path-to-your-checkpoint"
 model = AutoModelForCausalLM.from_pretrained(
-    model_path,
     torch_dtype="auto",
     device_map="auto",
     trust_remote_code=True,
 )
-tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
 prompt = "1+1=2, 1+2="
 inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(model.device)
@@ -118,14 +118,14 @@ For our instruct model (Moonlight-16B-A3B-Instruct):
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-model_path = "path-to-your-checkpoint"
 model = AutoModelForCausalLM.from_pretrained(
-    model_path,
     torch_dtype="auto",
     device_map="auto",
     trust_remote_code=True
 )
-tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
 prompt = "Give me a short introduction to large language model."
 messages = [

 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+model_name = "moonshotai/Moonlight-16B-A3B"
 model = AutoModelForCausalLM.from_pretrained(
+    model_name,
     torch_dtype="auto",
     device_map="auto",
     trust_remote_code=True,
 )
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 prompt = "1+1=2, 1+2="
 inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(model.device)
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+model_name = "moonshotai/Moonlight-16B-A3B-Instruct"
 model = AutoModelForCausalLM.from_pretrained(
+    model_name,
     torch_dtype="auto",
     device_map="auto",
     trust_remote_code=True
 )
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 prompt = "Give me a short introduction to large language model."
 messages = [