SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
supportive
  • '"Die jungen Revolutionäre: Klima-Aktivist*innen erzwingen politische Verantwortung!\n\nInmitten der politischen Apathie und korporatistischen Dominanz, gibt es Hoffnung: die jungen Menschen, die sich für den Schutz unseres Planeten einsetzen. Die Fridays for Future-Demonstrationen und ähnliche Aktionen zeigen, dass die Zeit des Stillstands vorbei ist. Es ist an der Zeit, dass Politiker endlich handeln, anstatt nur zu reden - und die jungen Menschen sind bereit, den Druck auszuüben, um dies zu erreichen."'
  • 'Die Bundesregierung plant die flächendeckende Einführung von Wärmepumpen in Deutschland. Ziel ist es, den Anteil erneuerbarer Wärme an der Gesamtwärmeversorgung zu erhöhen und den CO2-Ausstoß zu reduzieren. Die Initiative soll auch die Energieeffizienz verbessern und die Abhängigkeit von fossilen Brennstoffen verringern. Experten hoffen, dass diese Maßnahme einen wichtigen Schritt in Richtung einer klimafreundlichen Zukunft darstellt.'
  • '„Heizkosten senken, CO2 reduzieren: Bund und Länder planen flächendeckende Einführung von Wärmepumpen. Die Initiative soll bis 2030 umgesetzt werden. Experten hoffen, dass die Maßnahme nicht nur den Klimaschutz fördert, sondern auch die Heizkosten für Millionen deutscher Haushalte senkt. In Zukunft sollen Wärmepumpen in neuen Gebäuden standardmäßig vorgesehen werden, um eine emissionsarme und wirtschaftliche Erwärmung zu ermöglichen.“'
opposed
  • '"Klima-Dramatik auf der Straße: Radikale Aktivisten blockieren die Realität ab"\n\nDie jüngste Aktion von "Fridays for Future" in Berlin hat wieder gezeigt, dass die Proteste der Klima-Aktivist*innen nicht nur lärmig und lahmlegen, sondern auch sinnlos sind. Statt konstruktiv an Lösungen zu arbeiten, verbringen sie ihre Zeit damit, Straßen zu blockieren und die Alltäglichkeit in Berlin zu stören. Wir brauchen Handlungsabkömmlinge, nicht bloße Demonstranten.'
  • '"Steuernde Fehlplanung: Grüne Wärme-Pumpe-Hysterie kostet Steuerzahler Milliarden"\n\nDie Regierung will uns mit einer teuren, ineffizienten und unpraktischen Wärmepumpen-Revolution in die Zukunft führen. Die flächendeckende Einführung dieser teuren Geräte wird den Stromverbrauch erhöhen, die Steuerzahler belasten und unsere Umwelt nicht wirklich schützen. Wir brauchen eine realistische Energiewende, nicht eine teure Fehlplanung von Grünen, die sich in ihre eigene Welt versenken."'
  • 'Neue Schikane an den Straßen: Bund plant Tempo-Limit für Autobahnen\nEin neuer Vorschlag des Bundesverkehrswegeplans (BVWP) will eine allgemeine Geschwindigkeitsbegrenzung auf Autobahnen einführen. Laut Plänen soll die Höchstgeschwindigkeit von derzeit 130 km/h auf 120 km/h reduziert werden. Kritiker warnen vor Auswirkungen auf den Verkehr und die Wirtschaft, da sich dies zu erheblichen Verzögerungen führen könnte, insbesondere bei Lkw-Fahrten. Der Vorschlag wird in der nächsten Sitzung des Bundesverkehrsministeriums diskutiert.'

Evaluation

Metrics

Label Accuracy
all 1.0

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("cbpuschmann/MiniLM-klimacoder_v0.4")
# Run inference
preds = model("\"Von 'Klimakriegen' zu rechten Schreien in die Menge: Proteste der jungen Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus distanzieren und sich an tatsächliche politische Gestaltung beteiligen.\"")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 36 64.4771 98
Label Training Sample Count
opposed 235
supportive 245

Training Hyperparameters

  • batch_size: (32, 32)
  • num_epochs: (1, 1)
  • max_steps: -1
  • sampling_strategy: oversampling
  • body_learning_rate: (2e-05, 1e-05)
  • head_learning_rate: 0.01
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0003 1 0.2397 -
0.0138 50 0.253 -
0.0276 100 0.152 -
0.0415 150 0.0264 -
0.0553 200 0.0064 -
0.0691 250 0.0014 -
0.0829 300 0.0007 -
0.0968 350 0.0003 -
0.1106 400 0.0002 -
0.1244 450 0.0002 -
0.1382 500 0.0002 -
0.1521 550 0.0001 -
0.1659 600 0.0001 -
0.1797 650 0.0003 -
0.1935 700 0.0001 -
0.2074 750 0.0001 -
0.2212 800 0.0001 -
0.2350 850 0.0 -
0.2488 900 0.0 -
0.2626 950 0.0 -
0.2765 1000 0.0 -
0.2903 1050 0.0 -
0.3041 1100 0.0 -
0.3179 1150 0.0 -
0.3318 1200 0.0 -
0.3456 1250 0.0 -
0.3594 1300 0.0 -
0.3732 1350 0.0 -
0.3871 1400 0.0 -
0.4009 1450 0.0 -
0.4147 1500 0.0 -
0.4285 1550 0.0 -
0.4424 1600 0.0 -
0.4562 1650 0.0 -
0.4700 1700 0.0 -
0.4838 1750 0.0 -
0.4976 1800 0.0 -
0.5115 1850 0.0 -
0.5253 1900 0.0 -
0.5391 1950 0.0 -
0.5529 2000 0.0 -
0.5668 2050 0.0 -
0.5806 2100 0.0 -
0.5944 2150 0.0 -
0.6082 2200 0.0 -
0.6221 2250 0.0 -
0.6359 2300 0.0 -
0.6497 2350 0.0 -
0.6635 2400 0.0 -
0.6774 2450 0.0 -
0.6912 2500 0.0 -
0.7050 2550 0.0 -
0.7188 2600 0.0 -
0.7327 2650 0.0 -
0.7465 2700 0.0 -
0.7603 2750 0.0 -
0.7741 2800 0.0 -
0.7879 2850 0.0 -
0.8018 2900 0.0 -
0.8156 2950 0.0 -
0.8294 3000 0.0 -
0.8432 3050 0.0 -
0.8571 3100 0.0 -
0.8709 3150 0.0 -
0.8847 3200 0.0 -
0.8985 3250 0.0 -
0.9124 3300 0.0 -
0.9262 3350 0.0 -
0.9400 3400 0.0 -
0.9538 3450 0.0 -
0.9677 3500 0.0 -
0.9815 3550 0.0 -
0.9953 3600 0.0 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0
  • Sentence Transformers: 3.2.1
  • Transformers: 4.42.2
  • PyTorch: 2.5.1+cu121
  • Datasets: 3.1.0
  • Tokenizers: 0.19.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
7
Safetensors
Model size
118M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for cbpuschmann/MiniLM-klimacoder_v0.4

Evaluation results