SZTAKI-HLT
/

mT5-large-HuAMR

Text2Text Generation

Inference Endpoints

Model card Files Files and versions Community

BotondBarta commited on 21 days ago

Commit

8c66b65

·

verified ·

1 Parent(s): f1cc042

Update README.md

Files changed (1) hide show

README.md +7 -1

README.md CHANGED Viewed

@@ -43,7 +43,13 @@ This model is a fine-tuned version of [google/mt5-large](https://huggingface.co/
 #### Training Hyperparameters
-- **Training regime:** [More Information Needed] <!--fp32 -->
 #### Metrics

 #### Training Hyperparameters
+- learning_rate: 5e-05
+- train_batch_size: 1
+- gradient_accumulation_steps: 16
+- total_train_batch_size: 16
+- optimizer: AdamW
+- lr_scheduler_type: linear
+- max_grad_norm: 0.3
 #### Metrics