nicholasKluge
commited on
Commit
•
0d2db58
1
Parent(s):
92d12af
Update README.md
Browse files
README.md
CHANGED
@@ -20,11 +20,11 @@ widget:
|
|
20 |
- text: "Uma conferência da ONU terminou no início do sábado com um plano vago para novas negociações informais sobre como diminuir o aquecimento global, mas sem um compromisso dos EUA com negociações multilaterais sobre os próximos passos, incluindo controles de emissões."
|
21 |
example_title: Exemplo
|
22 |
---
|
23 |
-
# TeenyTinyLlama-
|
24 |
|
25 |
TeenyTinyLlama is a series of small foundational models trained in Brazilian Portuguese.
|
26 |
|
27 |
-
This repository contains a version of [TeenyTinyLlama-
|
28 |
|
29 |
## Details
|
30 |
|
@@ -43,7 +43,7 @@ from transformers import pipeline
|
|
43 |
text = "Quando falamos de Inteligência Artificial, hoje em dia existem já vários sistemas que começam a ganhar popularidade,\
|
44 |
embora nenhum seja ainda tão conhecido como o ChatGPT da OpenAI."
|
45 |
|
46 |
-
classifier = pipeline("text-classification", model="nicholasKluge/TeenyTinyLlama-
|
47 |
classifier(text)
|
48 |
|
49 |
# >>> [{'label': 'TECNOLOGIA', 'score': 0.9997298121452332}]
|
@@ -69,13 +69,13 @@ dataset = load_dataset("maritaca-ai/ag_news_pt")
|
|
69 |
|
70 |
# Create a `ModelForSequenceClassification`
|
71 |
model = AutoModelForSequenceClassification.from_pretrained(
|
72 |
-
"nicholasKluge/TeenyTinyLlama-
|
73 |
num_labels=4,
|
74 |
id2label={0: "MUNDO", 1: "ESPORTES", 2: "NEGÓCIOS", 3: "TECNOLOGIA"},
|
75 |
label2id={"MUNDO": 0, "ESPORTES": 1, "NEGÓCIOS": 2, "TECNOLOGIA": 3}
|
76 |
)
|
77 |
|
78 |
-
tokenizer = AutoTokenizer.from_pretrained("nicholasKluge/TeenyTinyLlama-
|
79 |
|
80 |
# Format the dataset
|
81 |
train = dataset['train'].to_pandas()
|
@@ -147,7 +147,7 @@ trainer.train()
|
|
147 |
|
148 |
| Models | [AgNews](https://huggingface.co/datasets/maritaca-ai/ag_news_pt) |
|
149 |
|--------------------------------------------------------------------------------------------|------------------------------------------------------------------|
|
150 |
-
| [Teeny Tiny Llama
|
151 |
| [Bert-base-portuguese-cased](https://huggingface.co/neuralmind/bert-base-portuguese-cased) | 94.19 |
|
152 |
| [Bert-large-portuguese-cased](https://huggingface.co/neuralmind/bert-base-portuguese-cased)| 94.11 |
|
153 |
| [Gpt2-small-portuguese](https://huggingface.co/pierreguillou/gpt2-small-portuguese) | 94.07 |
|
@@ -158,7 +158,7 @@ trainer.train()
|
|
158 |
|
159 |
@misc{nicholas22llama,
|
160 |
doi = {10.5281/zenodo.6989727},
|
161 |
-
url = {https://huggingface.co/nicholasKluge/TeenyTinyLlama-
|
162 |
author = {Nicholas Kluge Corrêa},
|
163 |
title = {TeenyTinyLlama},
|
164 |
year = {2023},
|
@@ -174,4 +174,4 @@ This repository was built as part of the RAIES ([Rede de Inteligência Artificia
|
|
174 |
|
175 |
## License
|
176 |
|
177 |
-
TeenyTinyLlama-
|
|
|
20 |
- text: "Uma conferência da ONU terminou no início do sábado com um plano vago para novas negociações informais sobre como diminuir o aquecimento global, mas sem um compromisso dos EUA com negociações multilaterais sobre os próximos passos, incluindo controles de emissões."
|
21 |
example_title: Exemplo
|
22 |
---
|
23 |
+
# TeenyTinyLlama-160m-AgNews
|
24 |
|
25 |
TeenyTinyLlama is a series of small foundational models trained in Brazilian Portuguese.
|
26 |
|
27 |
+
This repository contains a version of [TeenyTinyLlama-160m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-160m) (`TeenyTinyLlama-160m-AgNews`) fine-tuned on the [AgNews dataset](https://huggingface.co/datasets/maritaca-ai/ag_news_pt).
|
28 |
|
29 |
## Details
|
30 |
|
|
|
43 |
text = "Quando falamos de Inteligência Artificial, hoje em dia existem já vários sistemas que começam a ganhar popularidade,\
|
44 |
embora nenhum seja ainda tão conhecido como o ChatGPT da OpenAI."
|
45 |
|
46 |
+
classifier = pipeline("text-classification", model="nicholasKluge/TeenyTinyLlama-160m-AgNews")
|
47 |
classifier(text)
|
48 |
|
49 |
# >>> [{'label': 'TECNOLOGIA', 'score': 0.9997298121452332}]
|
|
|
69 |
|
70 |
# Create a `ModelForSequenceClassification`
|
71 |
model = AutoModelForSequenceClassification.from_pretrained(
|
72 |
+
"nicholasKluge/TeenyTinyLlama-160m",
|
73 |
num_labels=4,
|
74 |
id2label={0: "MUNDO", 1: "ESPORTES", 2: "NEGÓCIOS", 3: "TECNOLOGIA"},
|
75 |
label2id={"MUNDO": 0, "ESPORTES": 1, "NEGÓCIOS": 2, "TECNOLOGIA": 3}
|
76 |
)
|
77 |
|
78 |
+
tokenizer = AutoTokenizer.from_pretrained("nicholasKluge/TeenyTinyLlama-160m")
|
79 |
|
80 |
# Format the dataset
|
81 |
train = dataset['train'].to_pandas()
|
|
|
147 |
|
148 |
| Models | [AgNews](https://huggingface.co/datasets/maritaca-ai/ag_news_pt) |
|
149 |
|--------------------------------------------------------------------------------------------|------------------------------------------------------------------|
|
150 |
+
| [Teeny Tiny Llama 160m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-160m) | 94.05 |
|
151 |
| [Bert-base-portuguese-cased](https://huggingface.co/neuralmind/bert-base-portuguese-cased) | 94.19 |
|
152 |
| [Bert-large-portuguese-cased](https://huggingface.co/neuralmind/bert-base-portuguese-cased)| 94.11 |
|
153 |
| [Gpt2-small-portuguese](https://huggingface.co/pierreguillou/gpt2-small-portuguese) | 94.07 |
|
|
|
158 |
|
159 |
@misc{nicholas22llama,
|
160 |
doi = {10.5281/zenodo.6989727},
|
161 |
+
url = {https://huggingface.co/nicholasKluge/TeenyTinyLlama-160m},
|
162 |
author = {Nicholas Kluge Corrêa},
|
163 |
title = {TeenyTinyLlama},
|
164 |
year = {2023},
|
|
|
174 |
|
175 |
## License
|
176 |
|
177 |
+
TeenyTinyLlama-160m-AgNews is licensed under the Apache License, Version 2.0. See the [LICENSE](LICENSE) file for more details.
|