roberta-base-qe-v1

This model is a fine-tuned version of FacebookAI/xlm-roberta-base on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 5e-05
train_batch_size: 128
eval_batch_size: 128
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
training_steps: 10000

Training Loss	Epoch	Step	Validation Loss
3506.7047	0.1004	1000	3535.8235
2802.0825	0.2007	2000	2828.0298
2801.5228	0.3011	3000	2828.0298
2778.03	0.4015	4000	2828.0298
2840.2956	0.5019	5000	2828.0298
2831.9678	0.6022	6000	2828.0298
2826.2297	0.7026	7000	2828.0298
2797.2078	0.8030	8000	2828.0298
2828.6419	0.9033	9000	2828.0298
2826.6844	1.0037	10000	2828.0298