hugohrban
/

progen2-small-mix7-bidi

Text Generation

Model card Files Files and versions Community

hugohrban commited on Apr 29, 2024

Commit

522d0fc

·

verified ·

1 Parent(s): 4e2e6d0

Update README.md

Files changed (1) hide show

README.md +7 -9

README.md CHANGED Viewed

@@ -15,20 +15,18 @@ Example usage:
 ```python
 from transformers import AutoModelForCausalLM
-from transformers import AutoTokenizer
-# optionally use local imports
-# from models.progen.modeling_progen import ProGenForCausalLM
-# from models.progen.configuration_progen import ProGenConfig
 import torch
 import torch.nn.functional as F
 # load model and tokenizer
 model = AutoModelForCausalLM.from_pretrained("hugohrban/progen2-small-mix7-bidi", trust_remote_code=True)
-tokenizer = AutoTokenizer.from_pretrained("hugohrban/progen2-small-mix7-bidi", trust_remote_code=True)
 # prepare input
-prompt = "<|pf00125|>2FDDDVSAVKSTGV"
-input_ids = torch.tensor(tokenizer.encode(prompt)).to(model.device)
 # forward pass
 logits = model(input_ids).logits
@@ -36,6 +34,6 @@ logits = model(input_ids).logits
 # print output probabilities
 next_token_logits = logits[-1, :]
 next_token_probs = F.softmax(next_token_logits, dim=-1)
-for i, prob in enumerate(next_token_probs):
-    print(f"{tokenizer.decode(i)}: {100 * prob:.2f}%")
 ```

 ```python
 from transformers import AutoModelForCausalLM
+from tokenizers import Tokenizer
 import torch
 import torch.nn.functional as F
 # load model and tokenizer
 model = AutoModelForCausalLM.from_pretrained("hugohrban/progen2-small-mix7-bidi", trust_remote_code=True)
+tokenizer = Tokenizer.from_pretrained("hugohrban/progen2-small-mix7-bidi")
+tokenizer.no_padding()
 # prepare input
+prompt = "<|pf00125|>2FDDDVSAVKSTGVSK"
+input_ids = torch.tensor(tokenizer.encode(prompt).ids).to(model.device)
 # forward pass
 logits = model(input_ids).logits
 # print output probabilities
 next_token_logits = logits[-1, :]
 next_token_probs = F.softmax(next_token_logits, dim=-1)
+for i in range(tokenizer.get_vocab_size(with_added_tokens=False)):
+    print(f"{tokenizer.id_to_token(i)}: {round(100 * next_token_probs[i].item(), 2):.2f} %")
 ```