RamsesDIIP commited on
Commit
adce5e3
1 Parent(s): 13a6c0c

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,671 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: intfloat/multilingual-e5-large
3
+ language:
4
+ - multilingual
5
+ library_name: sentence-transformers
6
+ license: apache-2.0
7
+ metrics:
8
+ - cosine_accuracy
9
+ - dot_accuracy
10
+ - manhattan_accuracy
11
+ - euclidean_accuracy
12
+ - max_accuracy
13
+ pipeline_tag: sentence-similarity
14
+ tags:
15
+ - sentence-transformers
16
+ - sentence-similarity
17
+ - feature-extraction
18
+ - generated_from_trainer
19
+ - dataset_size:10590
20
+ - loss:MultipleNegativesRankingLoss
21
+ widget:
22
+ - source_sentence: 'query: Silla de listones de madera tropical, de 68 cm de longitud,
23
+ con protección fungicida insecticida e hidrófuga, acabado incoloro, con respaldo,
24
+ soportes y apoyabrazos de madera, colocada con fijaciones mecánicas'
25
+ sentences:
26
+ - 'passage: Pavimento de losas de concreto de diseño irregular con bordes rectos,
27
+ de 10 cm de grosor, a un costo elevado, instaladas con mezcla de cemento en proporción
28
+ 1:4, en un área urbana con fácil acceso, en aceras de más de 3 y hasta 5 m de
29
+ ancho o en calzadas/plataformas únicas de más de 7 y hasta 12 m de ancho, considerando
30
+ la interferencia de servicios o mobiliario urbano, en proyectos de hasta 1 m2.'
31
+ - 'passage: Silla de listones de madera reciclada, de 68 cm de longitud, con tratamiento
32
+ anti-UV y resistente a la humedad, acabado mate, sin respaldo, soportes y apoyabrazos
33
+ de metal, ensamblada con adhesivos estructurales.'
34
+ - 'passage: Silla de madera tropical de 68 cm de largo, tratada con protección contra
35
+ hongos e insectos, con un acabado transparente, que incluye respaldo, soportes
36
+ y reposabrazos de madera, ensamblada con anclajes mecánicos.'
37
+ - source_sentence: 'query: Radiador de pie con intercambiador de calor interno sencillo
38
+ de tubo de cobre con aletas de aluminio y de bajo caudal de agua, con armazón
39
+ de plancha de acero antivandálica lacado de 20 a 25 cm de ancho 65 a 75 cm de
40
+ altura y 125 a 145 cm de longitud, con purgador, tapon de vaciado y elementos
41
+ de montaje, colocado de pie'
42
+ sentences:
43
+ - 'passage: Radiador vertical con intercambiador de calor de tubo de cobre y aletas
44
+ de aluminio, diseñado para un bajo flujo de agua, con estructura de acero lacado
45
+ resistente al vandalismo, dimensiones de 20 a 25 cm de ancho, 65 a 75 cm de alto
46
+ y 125 a 145 cm de largo, equipado con purgador, tapón de drenaje y accesorios
47
+ de instalación.'
48
+ - 'passage: Formigonament de rases i pous, utilitzant formigó HA - 35 / B / 10 /
49
+ XC4 + XA1 amb una dosi de ciment de 325 kg/m3 i una relació aigua-ciment no superior
50
+ a 0.5, abocat mitjançant cubilot.'
51
+ - 'passage: Radiador de pared con intercambiador de calor externo complejo de tubo
52
+ de acero inoxidable sin aletas y de alto caudal de agua, con estructura de aluminio
53
+ anodizado de 30 a 35 cm de ancho, 70 a 80 cm de altura y 130 a 150 cm de longitud,
54
+ sin purgador, tapón de llenado y elementos de desmontaje, instalado en posición
55
+ horizontal.'
56
+ - source_sentence: 'query: Formación de forjado aligerado de espesor 10+15+5 cm con
57
+ un canto total de 30 cm y de 163 a 353 kN·m de momento flector último, para una
58
+ sobrecarga (uso+permanentes) de 4 a 5 kN/m2, formado por semiplaca de hormigón
59
+ pretensado (prelosa) de 10 cm de espesor, 120 a 250 cm de anchura y de luz máx.
60
+ 8 m, bovedilla poliestireno de 15 cm de altura y capa de compresión de 5 cm de
61
+ espesor, con una cuantía de 3 kg/ m2 de armadura AP500 S de acero en barras corrugadas,
62
+ armadura AP500 T en mallas electrosoldadas de 15x15 cm y D 6 mm, y una cuantia
63
+ de hormigón 0.086 m3/m2 hormigón para armar HA - 30 / F / 20 / XC4 + XD3 con una
64
+ cantidad de cemento de 325 kg/m3 i relación agua cemento =< 0.5, vertido con cubilote'
65
+ sentences:
66
+ - 'passage: Pavimento de mezcla asfáltica continua en caliente tipo AC 22 base B
67
+ 35/50 G de baja temperatura, utilizando betún asfáltico de penetración y granulometría
68
+ gruesa para la capa base, reciclado de mezcla bituminosa y árido calcáreo, aplicado
69
+ y compactado en un entorno urbano con movilidad restringida, en aceras de más
70
+ de 3 y hasta 5 m de ancho o calzada/plataforma única de más de 7 y hasta 12 m
71
+ de ancho, afectado por servicios o elementos de mobiliario urbano, en proyectos
72
+ que superan los 10 m2.'
73
+ - 'passage: Formación de forjado macizo de espesor 20 cm con un canto total de 40
74
+ cm y de 200 a 400 kN·m de momento flector último, para una sobrecarga (uso+permanentes)
75
+ de 6 a 7 kN/m2, formado por losas de hormigón armado de 20 cm de espesor, 150
76
+ a 300 cm de anchura y de luz máx. 10 m, sin bovedilla, y capa de compresión de
77
+ 10 cm de espesor, con una cuantía de 4 kg/m2 de armadura AP600 S de acero en barras
78
+ corrugadas, armadura AP600 T en mallas electrosoldadas de 20x20 cm y D 8 mm, y
79
+ una cuantía de hormigón 0.1 m3/m2 hormigón para armar HA - 35 / F / 25 / XC3 +
80
+ XD2 con una cantidad de cemento de 350 kg/m3 y relación agua cemento =< 0.45,
81
+ vertido con bomba.'
82
+ - 'passage: Construcción de un forjado aligerado con un espesor total de 30 cm,
83
+ compuesto por una semiplaca de hormigón pretensado de 10 cm, bovedillas de poliestireno
84
+ de 15 cm y una capa de compresión de 5 cm, diseñado para soportar momentos flectores
85
+ de 163 a 353 kN·m y una sobrecarga de 4 a 5 kN/m2, utilizando armadura de acero
86
+ AP500 S y AP500 T, y hormigón HA - 30 con una dosificación de cemento de 325 kg/m3.'
87
+ - source_sentence: 'query: Hormigonado para encepados, con hormigón para armar con
88
+ aditivo hidrófugo HA - 35 / B / 10 / XC4 + XD3 con una cantidad de cemento de
89
+ 325 kg/m3 i relación agua cemento =< 0.5, colocado con bomba en obras de ingeniería
90
+ civil'
91
+ sentences:
92
+ - 'passage: Colocación de hormigón para cimentaciones, utilizando mezcla con aditivo
93
+ impermeabilizante HA - 35 / B / 10 / XC4 + XD3, con una dosificación de cemento
94
+ de 325 kg/m3 y una relación agua-cemento menor o igual a 0.5, aplicado mediante
95
+ bomba en proyectos de infraestructura.'
96
+ - 'passage: Coberta amb panell sandvitx d''acer amb aïllament de poliisocianurat
97
+ (PIR) que presenta millores en la resistència al foc, amb un gruix total de 40
98
+ mm, cara exterior nervada en color estàndard, diferent del blanc, i cara interior
99
+ llisa, prelacada a les dues cares, gruix de les planxes (ext/int) 0.6/0.4 mm,
100
+ junt longitudinal encadenat, amb fixació oculta mitjançant tapajunts, amb un pendent
101
+ mínim del 4%.'
102
+ - 'passage: Hormigonado para fundaciones, con hormigón para estructuras con aditivo
103
+ retardante HA - 35 / B / 10 / XC4 + XD3 con una cantidad de cemento de 350 kg/m3
104
+ i relación agua cemento =< 0.6, colocado manualmente en proyectos de edificación.'
105
+ - source_sentence: 'query: Paret divisòria per a interior de panell de fusta contralaminada
106
+ de 150 mm de gruix formada per 5 capes de fusta d''avet C24, encolades amb adhesiu
107
+ sense urea-formaldehíde amb la disposició transversal de la fusta en les dues
108
+ cares del panell, amb tractament hidròfug, amb acabat superficial tipus habitatge
109
+ en les dues cares amb fusta d''avet roig amb fusta de Làrix europeu envernissat
110
+ en l''altre en l''altre col·locat amb fixacions mecàniques, desolidarització del
111
+ suport amb banda resilient de cautxú EPDM extruït, fixada amb grapes; unió entre
112
+ panells encadellat fixats amb cargols d''acer i segellat de la cara interior dels
113
+ junts amb cinta adhesiva de goma butílica, amb armadura de polièster i segellat
114
+ de la cara exterior amb cinta autoadhessiva de polietilè amb adhesiu acrílic sense
115
+ dissolvents, amb armadura de polietilè i pel·lícula de separació de paper siliconat,
116
+ prèvia aplicació d''imprimació incolora a base d'' una dispersió acrílica sense
117
+ dissolvents; resolució de traves amb cargols d''acer; fixació de panells amb elements
118
+ d''acer galvanitzat'
119
+ sentences:
120
+ - 'passage: Banc de metall d''alumini anoditzat, de 150 cm de llarg, amb suports
121
+ de fosa d''alumini, instal·lat amb fixacions mecàniques, en un entorn urbà amb
122
+ dificultats d''accés, en voreres de fins a 3 m d''amplada o calçades/plataformes
123
+ úniques de fins a 7 m d''amplada, amb interferències per serveis o elements de
124
+ mobiliari urbà, en projectes de 1 a 5 unitats.'
125
+ - 'passage: Paret separadora per a interiors de panell de fusta contralaminada de
126
+ 150 mm de gruix composta per 5 capes de fusta d''avet C24, encolades amb adhesiu
127
+ sense urea-formaldehíde, amb la disposició transversal de la fusta a les dues
128
+ cares del panell, tractada per a resistència a la humitat, amb acabat superficial
129
+ de tipus residencial en ambdues cares amb fusta d''avet roig i fusta de Làrix
130
+ europeu envernissat a l''altre costat, instal·lada amb fixacions mecàniques, desolidarització
131
+ del suport mitjançant banda resilient de cautxú EPDM extruït, fixada amb grapes;
132
+ unió entre panells encadenada amb cargols d''acer i segellat de la cara interior
133
+ dels junts amb cinta adhesiva de goma butílica, amb armadura de polièster i segellat
134
+ de la cara exterior amb cinta autoadhesiva de polietilè amb adhesiu acrílic sense
135
+ dissolvents, amb armadura de polietilè i pel·lícula de separació de paper siliconat,
136
+ després d''aplicar una imprimació incolora a base d''una dispersió acrílica sense
137
+ dissolvents; resolució de traves amb cargols d''acer; fixació de panells amb elements
138
+ d''acer galvanitzat.'
139
+ - 'passage: Paret divisòria per a exterior de panell de fusta massissa de 200 mm
140
+ de gruix formada per 3 capes de fusta de pi, encolades amb adhesiu amb urea-formaldehíde
141
+ amb la disposició longitudinal de la fusta en una sola cara del panell, sense
142
+ tractament hidròfug, amb acabat superficial tipus industrial en una sola cara
143
+ amb fusta de pi blanc, col·locat amb soldadura, unió entre panells amb encaix
144
+ fixats amb cargols de plàstic i segellat de la cara interior dels junts amb cinta
145
+ adhesiva de polipropilè, amb armadura de fibra de vidre i segellat de la cara
146
+ exterior amb cinta de tela amb adhesiu de cautxú, amb armadura de fibra de vidre
147
+ i pel·lícula de separació de plàstic, prèvia aplicació d''imprimació colorida
148
+ a base d''una dispersió aquosa; resolució de traves amb cargols de plàstic; fixació
149
+ de panells amb elements de plàstic reciclable.'
150
+ model-index:
151
+ - name: Multilingual E5 Large trained with triplet loss
152
+ results:
153
+ - task:
154
+ type: triplet
155
+ name: Triplet
156
+ dataset:
157
+ name: validation set
158
+ type: validation-set
159
+ metrics:
160
+ - type: cosine_accuracy
161
+ value: 0.8810198300283286
162
+ name: Cosine Accuracy
163
+ - type: dot_accuracy
164
+ value: 0.11898016997167139
165
+ name: Dot Accuracy
166
+ - type: manhattan_accuracy
167
+ value: 0.8800755429650614
168
+ name: Manhattan Accuracy
169
+ - type: euclidean_accuracy
170
+ value: 0.8810198300283286
171
+ name: Euclidean Accuracy
172
+ - type: max_accuracy
173
+ value: 0.8810198300283286
174
+ name: Max Accuracy
175
+ - type: cosine_accuracy
176
+ value: 1.0
177
+ name: Cosine Accuracy
178
+ - type: dot_accuracy
179
+ value: 0.0
180
+ name: Dot Accuracy
181
+ - type: manhattan_accuracy
182
+ value: 1.0
183
+ name: Manhattan Accuracy
184
+ - type: euclidean_accuracy
185
+ value: 1.0
186
+ name: Euclidean Accuracy
187
+ - type: max_accuracy
188
+ value: 1.0
189
+ name: Max Accuracy
190
+ - task:
191
+ type: triplet
192
+ name: Triplet
193
+ dataset:
194
+ name: test set
195
+ type: test-set
196
+ metrics:
197
+ - type: cosine_accuracy
198
+ value: 1.0
199
+ name: Cosine Accuracy
200
+ - type: dot_accuracy
201
+ value: 0.0
202
+ name: Dot Accuracy
203
+ - type: manhattan_accuracy
204
+ value: 1.0
205
+ name: Manhattan Accuracy
206
+ - type: euclidean_accuracy
207
+ value: 1.0
208
+ name: Euclidean Accuracy
209
+ - type: max_accuracy
210
+ value: 1.0
211
+ name: Max Accuracy
212
+ ---
213
+
214
+ # Multilingual E5 Large trained with triplet loss
215
+
216
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) on the csv dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
217
+
218
+ ## Model Details
219
+
220
+ ### Model Description
221
+ - **Model Type:** Sentence Transformer
222
+ - **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision ab10c1a7f42e74530fe7ae5be82e6d4f11a719eb -->
223
+ - **Maximum Sequence Length:** 512 tokens
224
+ - **Output Dimensionality:** 1024 tokens
225
+ - **Similarity Function:** Cosine Similarity
226
+ - **Training Dataset:**
227
+ - csv
228
+ - **Language:** multilingual
229
+ - **License:** apache-2.0
230
+
231
+ ### Model Sources
232
+
233
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
234
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
235
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
236
+
237
+ ### Full Model Architecture
238
+
239
+ ```
240
+ SentenceTransformer(
241
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
242
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
243
+ (2): Normalize()
244
+ )
245
+ ```
246
+
247
+ ## Usage
248
+
249
+ ### Direct Usage (Sentence Transformers)
250
+
251
+ First install the Sentence Transformers library:
252
+
253
+ ```bash
254
+ pip install -U sentence-transformers
255
+ ```
256
+
257
+ Then you can load this model and run inference.
258
+ ```python
259
+ from sentence_transformers import SentenceTransformer
260
+
261
+ # Download from the 🤗 Hub
262
+ model = SentenceTransformer("RamsesDIIP/me5-large-construction-esp-cat-v2")
263
+ # Run inference
264
+ sentences = [
265
+ "query: Paret divisòria per a interior de panell de fusta contralaminada de 150 mm de gruix formada per 5 capes de fusta d'avet C24, encolades amb adhesiu sense urea-formaldehíde amb la disposició transversal de la fusta en les dues cares del panell, amb tractament hidròfug, amb acabat superficial tipus habitatge en les dues cares amb fusta d'avet roig amb fusta de Làrix europeu envernissat en l'altre en l'altre col·locat amb fixacions mecàniques, desolidarització del suport amb banda resilient de cautxú EPDM extruït, fixada amb grapes; unió entre panells encadellat fixats amb cargols d'acer i segellat de la cara interior dels junts amb cinta adhesiva de goma butílica, amb armadura de polièster i segellat de la cara exterior amb cinta autoadhessiva de polietilè amb adhesiu acrílic sense dissolvents, amb armadura de polietilè i pel·lícula de separació de paper siliconat, prèvia aplicació d'imprimació incolora a base d' una dispersió acrílica sense dissolvents; resolució de traves amb cargols d'acer; fixació de panells amb elements d'acer galvanitzat",
266
+ "passage: Paret separadora per a interiors de panell de fusta contralaminada de 150 mm de gruix composta per 5 capes de fusta d'avet C24, encolades amb adhesiu sense urea-formaldehíde, amb la disposició transversal de la fusta a les dues cares del panell, tractada per a resistència a la humitat, amb acabat superficial de tipus residencial en ambdues cares amb fusta d'avet roig i fusta de Làrix europeu envernissat a l'altre costat, instal·lada amb fixacions mecàniques, desolidarització del suport mitjançant banda resilient de cautxú EPDM extruït, fixada amb grapes; unió entre panells encadenada amb cargols d'acer i segellat de la cara interior dels junts amb cinta adhesiva de goma butílica, amb armadura de polièster i segellat de la cara exterior amb cinta autoadhesiva de polietilè amb adhesiu acrílic sense dissolvents, amb armadura de polietilè i pel·lícula de separació de paper siliconat, després d'aplicar una imprimació incolora a base d'una dispersió acrílica sense dissolvents; resolució de traves amb cargols d'acer; fixació de panells amb elements d'acer galvanitzat.",
267
+ "passage: Paret divisòria per a exterior de panell de fusta massissa de 200 mm de gruix formada per 3 capes de fusta de pi, encolades amb adhesiu amb urea-formaldehíde amb la disposició longitudinal de la fusta en una sola cara del panell, sense tractament hidròfug, amb acabat superficial tipus industrial en una sola cara amb fusta de pi blanc, col·locat amb soldadura, unió entre panells amb encaix fixats amb cargols de plàstic i segellat de la cara interior dels junts amb cinta adhesiva de polipropilè, amb armadura de fibra de vidre i segellat de la cara exterior amb cinta de tela amb adhesiu de cautxú, amb armadura de fibra de vidre i pel·lícula de separació de plàstic, prèvia aplicació d'imprimació colorida a base d'una dispersió aquosa; resolució de traves amb cargols de plàstic; fixació de panells amb elements de plàstic reciclable.",
268
+ ]
269
+ embeddings = model.encode(sentences)
270
+ print(embeddings.shape)
271
+ # [3, 1024]
272
+
273
+ # Get the similarity scores for the embeddings
274
+ similarities = model.similarity(embeddings, embeddings)
275
+ print(similarities.shape)
276
+ # [3, 3]
277
+ ```
278
+
279
+ <!--
280
+ ### Direct Usage (Transformers)
281
+
282
+ <details><summary>Click to see the direct usage in Transformers</summary>
283
+
284
+ </details>
285
+ -->
286
+
287
+ <!--
288
+ ### Downstream Usage (Sentence Transformers)
289
+
290
+ You can finetune this model on your own dataset.
291
+
292
+ <details><summary>Click to expand</summary>
293
+
294
+ </details>
295
+ -->
296
+
297
+ <!--
298
+ ### Out-of-Scope Use
299
+
300
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
301
+ -->
302
+
303
+ ## Evaluation
304
+
305
+ ### Metrics
306
+
307
+ #### Triplet
308
+ * Dataset: `validation-set`
309
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
310
+
311
+ | Metric | Value |
312
+ |:-------------------|:----------|
313
+ | cosine_accuracy | 0.881 |
314
+ | dot_accuracy | 0.119 |
315
+ | manhattan_accuracy | 0.8801 |
316
+ | euclidean_accuracy | 0.881 |
317
+ | **max_accuracy** | **0.881** |
318
+
319
+ #### Triplet
320
+ * Dataset: `validation-set`
321
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
322
+
323
+ | Metric | Value |
324
+ |:-------------------|:--------|
325
+ | cosine_accuracy | 1.0 |
326
+ | dot_accuracy | 0.0 |
327
+ | manhattan_accuracy | 1.0 |
328
+ | euclidean_accuracy | 1.0 |
329
+ | **max_accuracy** | **1.0** |
330
+
331
+ #### Triplet
332
+ * Dataset: `test-set`
333
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
334
+
335
+ | Metric | Value |
336
+ |:-------------------|:--------|
337
+ | cosine_accuracy | 1.0 |
338
+ | dot_accuracy | 0.0 |
339
+ | manhattan_accuracy | 1.0 |
340
+ | euclidean_accuracy | 1.0 |
341
+ | **max_accuracy** | **1.0** |
342
+
343
+ <!--
344
+ ## Bias, Risks and Limitations
345
+
346
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
347
+ -->
348
+
349
+ <!--
350
+ ### Recommendations
351
+
352
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
353
+ -->
354
+
355
+ ## Training Details
356
+
357
+ ### Training Dataset
358
+
359
+ #### csv
360
+
361
+ * Dataset: csv
362
+ * Size: 10,590 training samples
363
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
364
+ * Approximate statistics based on the first 1000 samples:
365
+ | | anchor | positive | negative |
366
+ |:--------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
367
+ | type | string | string | string |
368
+ | details | <ul><li>min: 28 tokens</li><li>mean: 111.15 tokens</li><li>max: 320 tokens</li></ul> | <ul><li>min: 28 tokens</li><li>mean: 108.5 tokens</li><li>max: 316 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 101.87 tokens</li><li>max: 303 tokens</li></ul> |
369
+ * Samples:
370
+ | anchor | positive | negative |
371
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
372
+ | <code>query: Filtre per a tub de 65 mm de diàmetre nominal, de 25 bar de pressió màxima de servei, cilíndric, amb portafiltres de 6" de diàmetre i muntat entre tubs</code> | <code>passage: Filtre per a tub de 65 mm de diàmetre nominal, amb una pressió màxima de 25 bar, de forma cilíndrica, equipat amb un portafiltres de 6" de diàmetre i instal·lat entre les canonades.</code> | <code>passage: Filtre per a tub de 50 mm de diàmetre nominal, de 20 bar de pressió màxima de servei, rectangular, amb portafiltres de 4" de diàmetre i instal·lat en línia amb vàlvules.</code> |
373
+ | <code>query: Radiador de fosa de 24 elements amb 3 columnes, de 725 mm d'alçària màxima, per a aigua calenta de 6 bar i 110 °C, com a màxim i amb suport per a anar encastat, amb valvuleria termostabilitzable per a sistema monotubular i purgador automàtic</code> | <code>passage: Radiador de fosa de 24 elements amb 3 columnes, d'una alçària màxima de 725 mm, dissenyat per a aigua calenta a 6 bar i 110 °C, amb suport per a instal·lar encastat, incloent valvuleria termostabilitzable per a sistema monotubular i purgador automàtic.</code> | <code>passage: Radiador de fosa de 20 elements amb 4 columnes, de 600 mm d'alçària mínima, per a aigua freda de 4 bar i 80 °C, com a mínim i amb suport per a instal·lar a la paret, amb valvuleria manual per a sistema bitubular i purgador manual.</code> |
374
+ | <code>query: Tanca per a espais públics de perfils de fusta tractada tornejats de disposició horitzontal i vertical, de 975 a 1075 mm d'alçària amb estructura de muntants de fusta tractada, encastada al suport amb daus de formigó, en entorn urbà sense dificultat de mobilitat, en voreres > 3 i <= 5 m d'amplària o calçada/plataforma única > 7 i <= 12 m d'amplària, amb afectació per serveis o elements de mobiliari urbà, en actuacions de més de 100 m</code> | <code>passage: Tanca per a zones públiques amb perfils de fusta tractada, dissenyada tant en posició horitzontal com vertical, amb una alçària que varia entre 975 i 1075 mm, suportada per muntants de fusta tractada fixats a la base amb blocs de formigó, adequada per a entorns urbans amb mobilitat accessible, en voreres d'amplada entre 3 i 5 m o en calçades/plataformes d'amplada entre 7 i 12 m, tenint en compte la presència de serveis o mobiliari urbà, per a projectes que superin els 100 m.</code> | <code>passage: Tanca per a espais privats de perfils de metall galvanitzat amb disposició vertical i horitzontal, de 800 a 1000 mm d'alçària amb estructura de muntants de metall, fixada al sòl amb fonaments de formigó, en entorn rural amb dificultats de mobilitat, en camins > 2 i <= 4 m d'amplària o carreteres/plataformes > 5 i <= 10 m d'amplària, sense afectació per serveis o elements de mobiliari urbà, en actuacions de menys de 50 m.</code> |
375
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
376
+ ```json
377
+ {
378
+ "scale": 20.0,
379
+ "similarity_fct": "cos_sim"
380
+ }
381
+ ```
382
+
383
+ ### Evaluation Dataset
384
+
385
+ #### csv
386
+
387
+ * Dataset: csv
388
+ * Size: 10,590 evaluation samples
389
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
390
+ * Approximate statistics based on the first 1000 samples:
391
+ | | anchor | positive | negative |
392
+ |:--------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
393
+ | type | string | string | string |
394
+ | details | <ul><li>min: 16 tokens</li><li>mean: 111.13 tokens</li><li>max: 341 tokens</li></ul> | <ul><li>min: 16 tokens</li><li>mean: 108.44 tokens</li><li>max: 310 tokens</li></ul> | <ul><li>min: 16 tokens</li><li>mean: 102.0 tokens</li><li>max: 331 tokens</li></ul> |
395
+ * Samples:
396
+ | anchor | positive | negative |
397
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
398
+ | <code>query: Tubo de aluminio extrusionado de 76 mm de diámetro, para señales de tráfico, colocada, en entorno urbano sin dificultad de movilidad, en aceras <= 3 m de ancho o calzada/plataforma única <= 7 m de ancho, con afectación por servicios o elementos de mobiliario urbano, en actuaciones de más de100 m</code> | <code>passage: Tubo de aluminio extruido de 76 mm de diámetro, destinado a señales viales, instalado en áreas urbanas con fácil acceso, en aceras de hasta 3 m de ancho o en calzadas/plataformas de hasta 7 m de ancho, considerando la interferencia de servicios o mobiliario urbano, en proyectos que superen los 100 m.</code> | <code>passage: Tubo de acero galvanizado de 80 mm de diámetro, para estructuras temporales, instalado en área rural con restricciones de acceso, en caminos <= 4 m de ancho o terrenos de servicio <= 8 m de ancho, sin interferencia de servicios o elementos de infraestructura, en proyectos de menos de 50 m.</code> |
399
+ | <code>query: Pavimento de losa de hormigón para pavimentos de 40x40 cm y 8 cm de espesor, de forma cuadrado, textura pétrea, precio alto, sobre lecho de arena de 5 cm de espesor, con relleno de juntas con arena fina y compactación del pavimento acabado, en entorno urbano con dificultad de mobilidad, en aceras > 3 y <= 5 m de ancho o calzada/plataforma única > 7 y <= 12 m de ancho, con afectación por servicios o elementos de mobiliario urbano, en actuaciones de hasta 1 m2</code> | <code>passage: Losas de concreto de 40x40 cm y 8 cm de grosor, con acabado rugoso, instaladas sobre una base de arena de 5 cm, con juntas rellenadas con arena fina y compactación final, en áreas urbanas con acceso limitado, en aceras de entre 3 y 5 m de ancho o calzadas de 7 a 12 m de ancho, considerando la interferencia de servicios y mobiliario urbano, en proyectos de hasta 1 m2.</code> | <code>passage: Pavimento de losa de cerámica para pavimentos de 30x30 cm y 1 cm de espesor, de forma rectangular, textura lisa, precio bajo, sobre base de grava de 2 cm de espesor, con sellado de juntas con silicona y nivelación del pavimento terminado, en entorno rural con fácil acceso, en caminos > 1 y <= 3 m de ancho o senderos/plataformas individuales > 5 y <= 7 m de ancho, sin afectación por servicios o elementos de mobiliario rural, en actuaciones de hasta 2 m2.</code> |
400
+ | <code>query: Reducción concéntrica de polietileno PE 100, fabricación manipulada, diámetro nominal DN 225 - DN 160, presión nominal PN 10 (SDR 17), para unión por soldadura a tope, de acuerdo con la norma UNE-EN 12201-3 y colocado en el fondo de la zanja en entorno urbano sin dificultad de movilidad, sin afectación por presencia de servicios en la zanja, con presencia de entibación</code> | <code>passage: Reducción concéntrica de polietileno PE 100, fabricada a medida, con diámetros nominales DN 225 - DN 160, presión nominal PN 10 (SDR 17), diseñada para unión por soldadura a tope, cumpliendo con la norma UNE-EN 12201-3 y colocada en el fondo de la zanja en un entorno urbano, garantizando fácil acceso y sin interferencias por servicios existentes, con soporte de entibación.</code> | <code>passage: Reducción excéntrica de polietileno PE 80, fabricación estándar, diámetro nominal DN 200 - DN 125, presión nominal PN 6 (SDR 21), para unión por soldadura eléctrica, de acuerdo con la norma UNE-EN 12201-2 y colocado en la parte superior de la zanja en entorno rural con dificultad de movilidad, con afectación por presencia de servicios en la zanja, sin necesidad de entibación.</code> |
401
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
402
+ ```json
403
+ {
404
+ "scale": 20.0,
405
+ "similarity_fct": "cos_sim"
406
+ }
407
+ ```
408
+
409
+ ### Training Hyperparameters
410
+ #### Non-Default Hyperparameters
411
+
412
+ - `eval_strategy`: steps
413
+ - `per_device_train_batch_size`: 6
414
+ - `per_device_eval_batch_size`: 6
415
+ - `learning_rate`: 4e-05
416
+ - `num_train_epochs`: 10
417
+ - `warmup_ratio`: 0.1
418
+ - `fp16`: True
419
+ - `load_best_model_at_end`: True
420
+ - `batch_sampler`: no_duplicates
421
+
422
+ #### All Hyperparameters
423
+ <details><summary>Click to expand</summary>
424
+
425
+ - `overwrite_output_dir`: False
426
+ - `do_predict`: False
427
+ - `eval_strategy`: steps
428
+ - `prediction_loss_only`: True
429
+ - `per_device_train_batch_size`: 6
430
+ - `per_device_eval_batch_size`: 6
431
+ - `per_gpu_train_batch_size`: None
432
+ - `per_gpu_eval_batch_size`: None
433
+ - `gradient_accumulation_steps`: 1
434
+ - `eval_accumulation_steps`: None
435
+ - `torch_empty_cache_steps`: None
436
+ - `learning_rate`: 4e-05
437
+ - `weight_decay`: 0.0
438
+ - `adam_beta1`: 0.9
439
+ - `adam_beta2`: 0.999
440
+ - `adam_epsilon`: 1e-08
441
+ - `max_grad_norm`: 1.0
442
+ - `num_train_epochs`: 10
443
+ - `max_steps`: -1
444
+ - `lr_scheduler_type`: linear
445
+ - `lr_scheduler_kwargs`: {}
446
+ - `warmup_ratio`: 0.1
447
+ - `warmup_steps`: 0
448
+ - `log_level`: passive
449
+ - `log_level_replica`: warning
450
+ - `log_on_each_node`: True
451
+ - `logging_nan_inf_filter`: True
452
+ - `save_safetensors`: True
453
+ - `save_on_each_node`: False
454
+ - `save_only_model`: False
455
+ - `restore_callback_states_from_checkpoint`: False
456
+ - `no_cuda`: False
457
+ - `use_cpu`: False
458
+ - `use_mps_device`: False
459
+ - `seed`: 42
460
+ - `data_seed`: None
461
+ - `jit_mode_eval`: False
462
+ - `use_ipex`: False
463
+ - `bf16`: False
464
+ - `fp16`: True
465
+ - `fp16_opt_level`: O1
466
+ - `half_precision_backend`: auto
467
+ - `bf16_full_eval`: False
468
+ - `fp16_full_eval`: False
469
+ - `tf32`: None
470
+ - `local_rank`: 0
471
+ - `ddp_backend`: None
472
+ - `tpu_num_cores`: None
473
+ - `tpu_metrics_debug`: False
474
+ - `debug`: []
475
+ - `dataloader_drop_last`: False
476
+ - `dataloader_num_workers`: 0
477
+ - `dataloader_prefetch_factor`: None
478
+ - `past_index`: -1
479
+ - `disable_tqdm`: False
480
+ - `remove_unused_columns`: True
481
+ - `label_names`: None
482
+ - `load_best_model_at_end`: True
483
+ - `ignore_data_skip`: False
484
+ - `fsdp`: []
485
+ - `fsdp_min_num_params`: 0
486
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
487
+ - `fsdp_transformer_layer_cls_to_wrap`: None
488
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
489
+ - `deepspeed`: None
490
+ - `label_smoothing_factor`: 0.0
491
+ - `optim`: adamw_torch
492
+ - `optim_args`: None
493
+ - `adafactor`: False
494
+ - `group_by_length`: False
495
+ - `length_column_name`: length
496
+ - `ddp_find_unused_parameters`: None
497
+ - `ddp_bucket_cap_mb`: None
498
+ - `ddp_broadcast_buffers`: False
499
+ - `dataloader_pin_memory`: True
500
+ - `dataloader_persistent_workers`: False
501
+ - `skip_memory_metrics`: True
502
+ - `use_legacy_prediction_loop`: False
503
+ - `push_to_hub`: False
504
+ - `resume_from_checkpoint`: None
505
+ - `hub_model_id`: None
506
+ - `hub_strategy`: every_save
507
+ - `hub_private_repo`: False
508
+ - `hub_always_push`: False
509
+ - `gradient_checkpointing`: False
510
+ - `gradient_checkpointing_kwargs`: None
511
+ - `include_inputs_for_metrics`: False
512
+ - `eval_do_concat_batches`: True
513
+ - `fp16_backend`: auto
514
+ - `push_to_hub_model_id`: None
515
+ - `push_to_hub_organization`: None
516
+ - `mp_parameters`:
517
+ - `auto_find_batch_size`: False
518
+ - `full_determinism`: False
519
+ - `torchdynamo`: None
520
+ - `ray_scope`: last
521
+ - `ddp_timeout`: 1800
522
+ - `torch_compile`: False
523
+ - `torch_compile_backend`: None
524
+ - `torch_compile_mode`: None
525
+ - `dispatch_batches`: None
526
+ - `split_batches`: None
527
+ - `include_tokens_per_second`: False
528
+ - `include_num_input_tokens_seen`: False
529
+ - `neftune_noise_alpha`: None
530
+ - `optim_target_modules`: None
531
+ - `batch_eval_metrics`: False
532
+ - `eval_on_start`: False
533
+ - `eval_use_gather_object`: False
534
+ - `batch_sampler`: no_duplicates
535
+ - `multi_dataset_batch_sampler`: proportional
536
+
537
+ </details>
538
+
539
+ ### Training Logs
540
+ | Epoch | Step | Training Loss | Validation Loss | validation-set_max_accuracy | test-set_max_accuracy |
541
+ |:----------:|:--------:|:-------------:|:---------------:|:---------------------------:|:---------------------:|
542
+ | 0 | 0 | - | - | 0.8810 | - |
543
+ | 0.1416 | 200 | 0.341 | 0.0055 | 1.0 | - |
544
+ | 0.2833 | 400 | 0.0079 | 0.0060 | 0.9991 | - |
545
+ | 0.4249 | 600 | 0.005 | 0.0020 | 1.0 | - |
546
+ | 0.5666 | 800 | 0.0013 | 0.0063 | 0.9981 | - |
547
+ | 0.7082 | 1000 | 0.0048 | 0.0044 | 0.9991 | - |
548
+ | 0.8499 | 1200 | 0.003 | 0.0048 | 1.0 | - |
549
+ | 0.9915 | 1400 | 0.013 | 0.0034 | 1.0 | - |
550
+ | 1.1331 | 1600 | 0.0135 | 0.0021 | 1.0 | - |
551
+ | 1.2748 | 1800 | 0.0063 | 0.0038 | 1.0 | - |
552
+ | 1.4164 | 2000 | 0.0066 | 0.0026 | 0.9991 | - |
553
+ | 1.5581 | 2200 | 0.0016 | 0.0027 | 0.9991 | - |
554
+ | 1.6997 | 2400 | 0.0013 | 0.0008 | 1.0 | - |
555
+ | 1.8414 | 2600 | 0.0034 | 0.0017 | 1.0 | - |
556
+ | 1.9830 | 2800 | 0.0045 | 0.0016 | 1.0 | - |
557
+ | 2.1246 | 3000 | 0.001 | 0.0004 | 1.0 | - |
558
+ | 2.2663 | 3200 | 0.0033 | 0.0009 | 1.0 | - |
559
+ | 2.4079 | 3400 | 0.0013 | 0.0019 | 0.9991 | - |
560
+ | 2.5496 | 3600 | 0.0009 | 0.0005 | 1.0 | - |
561
+ | 2.6912 | 3800 | 0.0023 | 0.0019 | 1.0 | - |
562
+ | 2.8329 | 4000 | 0.0012 | 0.0026 | 1.0 | - |
563
+ | 2.9745 | 4200 | 0.0003 | 0.0005 | 1.0 | - |
564
+ | 3.1161 | 4400 | 0.0021 | 0.0017 | 1.0 | - |
565
+ | 3.2578 | 4600 | 0.0012 | 0.0076 | 0.9991 | - |
566
+ | 3.3994 | 4800 | 0.0006 | 0.0004 | 1.0 | - |
567
+ | 3.5411 | 5000 | 0.0002 | 0.0010 | 1.0 | - |
568
+ | 3.6827 | 5200 | 0.0003 | 0.0010 | 1.0 | - |
569
+ | 3.8244 | 5400 | 0.0012 | 0.0013 | 1.0 | - |
570
+ | 3.9660 | 5600 | 0.0004 | 0.0011 | 1.0 | - |
571
+ | 4.1076 | 5800 | 0.0001 | 0.0029 | 1.0 | - |
572
+ | 4.2493 | 6000 | 0.0001 | 0.0016 | 1.0 | - |
573
+ | 4.3909 | 6200 | 0.0002 | 0.0042 | 1.0 | - |
574
+ | 4.5326 | 6400 | 0.0001 | 0.0033 | 1.0 | - |
575
+ | 4.6742 | 6600 | 0.0003 | 0.0015 | 1.0 | - |
576
+ | 4.8159 | 6800 | 0.0001 | 0.0009 | 1.0 | - |
577
+ | **4.9575** | **7000** | **0.0001** | **0.0002** | **1.0** | **-** |
578
+ | 5.0992 | 7200 | 1.6191 | 2.4829 | 0.6893 | - |
579
+ | 5.2408 | 7400 | 2.4855 | 2.4829 | 0.5921 | - |
580
+ | 5.3824 | 7600 | 2.484 | 2.4829 | 0.6308 | - |
581
+ | 5.5241 | 7800 | 2.4877 | 2.4829 | 0.5005 | - |
582
+ | 5.6657 | 8000 | 2.4875 | 2.4829 | 0.5137 | - |
583
+ | 5.8074 | 8200 | 2.479 | 2.4829 | 0.5024 | - |
584
+ | 5.9490 | 8400 | 2.5288 | 2.4165 | 0.6789 | - |
585
+ | 6.0907 | 8600 | 2.5154 | 2.4829 | 0.4476 | - |
586
+ | 6.2323 | 8800 | 2.4743 | 2.4829 | 0.4920 | - |
587
+ | 6.3739 | 9000 | 2.476 | 2.4829 | 0.4589 | - |
588
+ | 6.5156 | 9200 | 2.4589 | 2.4829 | 0.4259 | - |
589
+ | 6.6572 | 9400 | 2.4584 | 2.4829 | 0.4117 | - |
590
+ | 6.7989 | 9600 | 2.4546 | 2.4829 | 0.4287 | - |
591
+ | 6.9405 | 9800 | 2.4623 | 2.4829 | 0.4410 | - |
592
+ | 7.0822 | 10000 | 2.4525 | 2.4829 | 0.4429 | - |
593
+ | 7.2238 | 10200 | 2.4396 | 2.4829 | 0.4514 | - |
594
+ | 7.3654 | 10400 | 2.422 | 2.4829 | 0.4570 | - |
595
+ | 7.5071 | 10600 | 2.4302 | 2.4829 | 0.4287 | - |
596
+ | 7.6487 | 10800 | 2.3866 | 2.4829 | 0.4259 | - |
597
+ | 7.7904 | 11000 | 2.4037 | 2.4829 | 0.4353 | - |
598
+ | 7.9320 | 11200 | 2.3875 | 2.4829 | 0.4315 | - |
599
+ | 8.0737 | 11400 | 2.3916 | 2.4829 | 0.4212 | - |
600
+ | 8.2153 | 11600 | 2.3829 | 2.4829 | 0.4079 | - |
601
+ | 8.3569 | 11800 | 2.3571 | 2.4829 | 0.4306 | - |
602
+ | 8.4986 | 12000 | 2.3312 | 2.4829 | 0.4297 | - |
603
+ | 8.6402 | 12200 | 2.3204 | 2.4829 | 0.4032 | - |
604
+ | 8.7819 | 12400 | 2.3304 | 2.4829 | 0.4268 | - |
605
+ | 8.9235 | 12600 | 2.3034 | 2.4829 | 0.4259 | - |
606
+ | 9.0652 | 12800 | 2.2823 | 2.4829 | 0.4070 | - |
607
+ | 9.2068 | 13000 | 2.2553 | 2.4829 | 0.4278 | - |
608
+ | 9.3484 | 13200 | 2.2879 | 2.4829 | 0.4372 | - |
609
+ | 9.4901 | 13400 | 2.2382 | 2.4829 | 0.4278 | - |
610
+ | 9.6317 | 13600 | 2.2388 | 2.4829 | 0.4466 | - |
611
+ | 9.7734 | 13800 | 2.2279 | 2.4829 | 0.4410 | - |
612
+ | 9.9150 | 14000 | 2.2446 | 2.4829 | 0.4551 | - |
613
+ | 10.0 | 14120 | - | - | 1.0 | 1.0 |
614
+
615
+ * The bold row denotes the saved checkpoint.
616
+
617
+ ### Framework Versions
618
+ - Python: 3.10.12
619
+ - Sentence Transformers: 3.2.0
620
+ - Transformers: 4.44.2
621
+ - PyTorch: 2.4.1+cu121
622
+ - Accelerate: 0.34.2
623
+ - Datasets: 3.0.1
624
+ - Tokenizers: 0.19.1
625
+
626
+ ## Citation
627
+
628
+ ### BibTeX
629
+
630
+ #### Sentence Transformers
631
+ ```bibtex
632
+ @inproceedings{reimers-2019-sentence-bert,
633
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
634
+ author = "Reimers, Nils and Gurevych, Iryna",
635
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
636
+ month = "11",
637
+ year = "2019",
638
+ publisher = "Association for Computational Linguistics",
639
+ url = "https://arxiv.org/abs/1908.10084",
640
+ }
641
+ ```
642
+
643
+ #### MultipleNegativesRankingLoss
644
+ ```bibtex
645
+ @misc{henderson2017efficient,
646
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
647
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
648
+ year={2017},
649
+ eprint={1705.00652},
650
+ archivePrefix={arXiv},
651
+ primaryClass={cs.CL}
652
+ }
653
+ ```
654
+
655
+ <!--
656
+ ## Glossary
657
+
658
+ *Clearly define terms in order to be accessible across audiences.*
659
+ -->
660
+
661
+ <!--
662
+ ## Model Card Authors
663
+
664
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
665
+ -->
666
+
667
+ <!--
668
+ ## Model Card Contact
669
+
670
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
671
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "intfloat/multilingual-e5-large",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.44.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.2.0",
4
+ "transformers": "4.44.2",
5
+ "pytorch": "2.4.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c2e8054e611f4c70161fd0eb1fc58136e2a0c97c13e06d019f5d3b0f7c328081
3
+ size 2239607176
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }