rufimelo
/

Legal-BERTimbau-sts-large

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

rufimelo commited on Jul 25, 2022

Commit

b86e966

·

1 Parent(s): 1dfa3a1

Update README.md

Files changed (1) hide show

README.md +16 -5

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
 - assin2
 ---
-# rufimelo/Legal-SBERTimbau-large
 This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 1024 dimensional dense vector space and can be used for tasks like clustering or semantic search.
 Legal-SBERTimbau-large is based on Legal-BERTimbau-large whioch derives from [BERTimbau](https://huggingface.co/neuralmind/bert-base-portuguese-cased) Large.
@@ -32,7 +32,7 @@ Then you can use the model like this:
 from sentence_transformers import SentenceTransformer
 sentences = ["Isto é um exemplo", "Isto é um outro exemplo"]
-model = SentenceTransformer('rufimelo/Legal-SBERTimbau-large')
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
@@ -58,8 +58,8 @@ def mean_pooling(model_output, attention_mask):
 sentences = ['This is an example sentence', 'Each sentence is converted']
 # Load model from HuggingFace Hub
-tokenizer = AutoTokenizer.from_pretrained('rufimelo/Legal-SBERTimbau-large')
-model = AutoModel.from_pretrained('rufimelo/Legal-SBERTimbau-large}')
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
@@ -106,4 +106,15 @@ SentenceTransformer(
 ## Citing & Authors
-<!--- Describe where people can find more information -->

 - assin2
 ---
+# rufimelo/Legal-SBERTimbau-nli-large
 This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 1024 dimensional dense vector space and can be used for tasks like clustering or semantic search.
 Legal-SBERTimbau-large is based on Legal-BERTimbau-large whioch derives from [BERTimbau](https://huggingface.co/neuralmind/bert-base-portuguese-cased) Large.
 from sentence_transformers import SentenceTransformer
 sentences = ["Isto é um exemplo", "Isto é um outro exemplo"]
+model = SentenceTransformer('rufimelo/Legal-SBERTimbau-nli-large')
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
 sentences = ['This is an example sentence', 'Each sentence is converted']
 # Load model from HuggingFace Hub
+tokenizer = AutoTokenizer.from_pretrained('rufimelo/Legal-SBERTimbau-nli-large')
+model = AutoModel.from_pretrained('rufimelo/Legal-SBERTimbau-nli-large}')
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
 ## Citing & Authors
+If you use this work, please cite BERTimbau's work:
+```bibtex
+@inproceedings{souza2020bertimbau,
+  author    = {F{\'a}bio Souza and
+               Rodrigo Nogueira and
+               Roberto Lotufo},
+  title     = {{BERT}imbau: pretrained {BERT} models for {B}razilian {P}ortuguese},
+  booktitle = {9th Brazilian Conference on Intelligent Systems, {BRACIS}, Rio Grande do Sul, Brazil, October 20-23 (to appear)},
+  year      = {2020}
+}
+```