Gabriel's picture
Update README.md
5f8d80e
|
raw
history blame
4.68 kB
metadata
language: sv
license: mit
datasets:
  - Gabriel/xsum_swe
tags:
  - summarization
widget:
  - text: >-
      Jordan Hill, Bretagne Covington och Tesfaye Cooper, alla 18, och Tanishia
      Covington, 24, dök upp i en Chicagodomstol på fredag. De fyra har åtalats
      för hatbrott och grov kidnappning och misshandel, bland annat. En
      insamling på nätet till deras offer har hittills samlat in $51.000
      (=42.500 pund). Domare Maria Kuriakos Ciesil förnekade borgen och frågade:
      Var fanns din anständighetskänsla? Åklagarna berättade för domstolen att
      misshandeln började i en skåpbil och fortsatte i ett hus, där de
      misstänkta påstås ha tvingat det 18-åriga vita offret, som lider av
      schizofreni och problem med uppmärksamhetsbrist, att dricka toalettvatten
      och kyssa golvet. Polisen hävdar att skåpbilen tidigare stals av Mr Hill,
      som också anklagas för att ha krävt 300 dollar av offrets mor medan de
      höll honom fången, enligt Chicago Tribune. Rätten fick också veta att de
      misstänkta stoppade en strumpa i munnen, tejpade igen munnen och band
      händerna med ett bälte. I en video gjord för Facebook Live som har setts
      miljontals gånger, kan angriparna höras göra nedsättande uttalanden mot
      vita människor och Donald Trump. Offret hade släppts av på en McDonalds
      för att träffa Mr Hill - som var en av hans vänner - den 31 december. Han
      hittades av en polis tisdagen den 3 januari, en dag efter att han anmäldes
      saknad av sina föräldrar. Åklagarna säger att de misstänkta möter två
      hatbrott räknas, en på grund av offrets ras och den andra på grund av hans
      funktionshinder.
inference:
  parameters:
    temperature: 0.7
    min_length: 30
    max_length: 120
model-index:
  - name: bart-base-cnn-xsum-swe
    results:
      - task:
          type: summarization
          name: summarization
        dataset:
          name: Gabriel/xsum_swe
          type: Gabriel/xsum_swe
          split: validation
        metrics:
          - name: Validation ROGUE-1.
            type: rouge-1
            value: 30.9467
            verified: true
          - name: Validation ROGUE-2
            type: rouge-2
            value: 12.2589
            verified: true
          - name: Validation ROGUE-L
            type: rouge-l
            value: 25.4487
            verified: true
          - name: Validation ROGUE-L-SUM
            type: rouge-l-sum
            value: 25.4792
            verified: true
train-eval-index:
  - config: Gabriel--xsum_swe
    task: summarization
    task_id: summarization
    splits:
      eval_split: train
    col_mapping:
      document: text
      summary: target
co2_eq_emissions:
  emissions: 0.0334
  source: Google Colab
  training_type: fine-tuning
  geographical_location: Fredericia, Denmark
  hardware_used: Tesla P100-PCIE-16GB

bart-base-cnn-xsum-swe

This model is a fine-tuned version of Gabriel/bart-base-cnn-swe on the None dataset. It achieves the following results on the evaluation set:

  • Loss: 2.1027
  • Rouge1: 30.9467
  • Rouge2: 12.2589
  • Rougel: 25.4487
  • Rougelsum: 25.4792
  • Gen Len: 19.7379

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 4e-05
  • train_batch_size: 16
  • eval_batch_size: 16
  • seed: 42
  • gradient_accumulation_steps: 2
  • total_train_batch_size: 32
  • optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_steps: 500
  • num_epochs: 4
  • mixed_precision_training: Native AMP

Training results

Training Loss Epoch Step Validation Loss Rouge1 Rouge2 Rougel Rougelsum Gen Len
2.3076 1.0 6375 2.1986 29.7041 10.9883 24.2149 24.2406 19.7193
2.0733 2.0 12750 2.1246 30.4521 11.8107 24.9519 24.9745 19.6592
1.8933 3.0 19125 2.0989 30.9407 12.2682 25.4135 25.4378 19.7195
1.777 4.0 25500 2.1027 30.9467 12.2589 25.4487 25.4792 19.7379

Framework versions

  • Transformers 4.22.2
  • Pytorch 1.12.1+cu113
  • Datasets 2.5.1
  • Tokenizers 0.12.1