1 contributor

History: 49 commits

lapp0

Training in progress, step 123750

fbad48a verified 3 months ago

attn_norm=instance_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instance_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instance_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instance_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instancenorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=instancenorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
End of training 3 months ago
attn_norm=instancenorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=instancenorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instancenorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=instancenorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
End of training 3 months ago
attn_norm=instancenorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=instancenorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
End of training 3 months ago
attn_norm=layernorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=mlp, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0001, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=16, warmup_ratio=0
Training in progress, step 61875 3 months ago
attn_norm=layernorm_teacher_only, attn_projector=orthogonal, attn_weight=5, learning_rate=0.0002, per_device_train_batch_size=8, warmup_ratio=0
Training in progress, step 123750 3 months ago