huseinzol05 commited on
Commit
993afdd
1 Parent(s): e1397a6

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +85 -1
README.md CHANGED
@@ -7,4 +7,88 @@ language:
7
 
8
  README at https://github.com/mesolitica/malaya/tree/5.1/session/mistral#7b-32768-context-length
9
 
10
- WandB, https://wandb.ai/mesolitica/fpf-mistral-7b-hf-32k?workspace=user-husein-mesolitica
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
 
8
  README at https://github.com/mesolitica/malaya/tree/5.1/session/mistral#7b-32768-context-length
9
 
10
+ WandB, https://wandb.ai/mesolitica/fpf-mistral-7b-hf-32k?workspace=user-husein-mesolitica
11
+
12
+ ```python
13
+ from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
14
+ import torch
15
+
16
+ TORCH_DTYPE = 'bfloat16'
17
+ nf4_config = BitsAndBytesConfig(
18
+ load_in_4bit=True,
19
+ bnb_4bit_quant_type='nf4',
20
+ bnb_4bit_use_double_quant=True,
21
+ bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
22
+ )
23
+
24
+ tokenizer = AutoTokenizer.from_pretrained('mesolitica/mistral-7b-32768-fpf')
25
+ model = AutoModelForCausalLM.from_pretrained(
26
+ 'mesolitica/mistral-7b-32768-fpf',
27
+ use_flash_attention_2 = True,
28
+ quantization_config = nf4_config
29
+ )
30
+
31
+ prompt = '<s>Soalan: KWSP tu apa?\nJawapan:'
32
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
33
+ generate_kwargs = dict(
34
+ inputs,
35
+ max_new_tokens=512,
36
+ top_p=0.95,
37
+ top_k=50,
38
+ temperature=0.9,
39
+ do_sample=True,
40
+ num_beams=1,
41
+ repetition_penalty=1.05,
42
+ )
43
+ r = model.generate(**generate_kwargs)
44
+ print(tokenizer.decode(r[0]))
45
+ ```
46
+
47
+ ```text
48
+ <s> Soalan: KWSP tu apa?
49
+ Jawapan: kwsp ialah kwsp iaitu kumpulan wang simpanan pekerja</s>
50
+ ```
51
+
52
+ ```python
53
+ prompt = '<s>Soalan: kenapa malaysia suka makan nasi lemak?\nJawapan:'
54
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
55
+ generate_kwargs = dict(
56
+ inputs,
57
+ max_new_tokens=512,
58
+ top_p=0.95,
59
+ top_k=50,
60
+ temperature=0.9,
61
+ do_sample=True,
62
+ num_beams=1,
63
+ repetition_penalty=1.05,
64
+ )
65
+ r = model.generate(**generate_kwargs)
66
+ print(tokenizer.decode(r[0]))
67
+ ```
68
+
69
+ ```text
70
+ <s> Soalan: kenapa malaysia suka makan nasi lemak?
71
+ Jawapan:Nasi Lemak merupakan antara sarapan pagi yang paling popular dalam kalangan rakyat Malaysia terutamanya orang Melayu. Ia mudah didapati di mana-mana sahaja seperti restoran mamak, gerai tepi jalan, gerai di pasar pagi, di stesen minyak, pasar malam, dan sebagainya. Sajian ini juga dikenali sebagai Nasi lemak antarabangsa kerana mendapat sambutan hangat daripada seluruh dunia. Selain itu, nasi lemak mempunyai bau yang sangat menyelerakan dan rasanya juga sangat unik. Tidak hairanlah mengapa ia digemari oleh ramai orang.Nasi lemak mempunyai santan, kerisik, dan serbuk kunyit yang ditumis dalam lemak kelapa dan dibungkus dalam daun pisang atau mangkuk plastik. Nasi lemak biasanya disajikan bersama ayam goreng, daging rendang, telur rebus, ikan bilis, timun, dan sambal yang dibuat daripada kacang tanah, udang atau petai. Variasi lain termasuk parutan kelapa muda, bilis goreng, udang goreng, dan sotong goreng. Di Malaysia, nasi lemak boleh didapati di gerai di jalanan, restoran tradisional, gerai di pasar pagi, dan di gerai tepi jalan di seluruh negara.</s>
72
+ ```
73
+
74
+ ```python
75
+ prompt = '<s>Soalan: macam mana nak install awscli dalam ubuntu\nJawapan:'
76
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
77
+ generate_kwargs = dict(
78
+ inputs,
79
+ max_new_tokens=512,
80
+ top_p=0.95,
81
+ top_k=50,
82
+ temperature=0.9,
83
+ do_sample=True,
84
+ num_beams=1,
85
+ repetition_penalty=1.05,
86
+ )
87
+ r = model.generate(**generate_kwargs)
88
+ print(tokenizer.decode(r[0]))
89
+ ```
90
+
91
+ ```text
92
+ <s> Soalan: macam mana nak install awscli dalam ubuntu
93
+ Jawapan: Anda boleh memasang awscli dalam Ubuntu dengan menggunakan pengurus pakej apt-get. Caranya adalah seperti berikut: 1. Buka terminal dan kemas kini senarai pakej dengan menjalankan arahan berikut: ```sudo apt-get update``` 2. Pasang awscli dengan menjalankan arahan berikut: ```sudo apt-get install awscli``` Selepas menyelesaikan langkah-langkah di atas, anda akan mempunyai awscli dipasang dalam Ubuntu anda. Anda boleh menggunakannya untuk berinteraksi dengan AWS SDK dalam kod Python anda.</s>
94
+ ```