Darsala
/

georgian_comet

Eval Results (legacy)

Model card Files Files and versions

Darsala commited on Jul 7, 2025

Commit

ec922d9

·

verified ·

1 Parent(s): 6350a5b

updates model

Files changed (2) hide show

checkpoints/model.ckpt +2 -2
hparams.yaml +11 -8

checkpoints/model.ckpt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac8322755c8fd64f438ce8d25176d81fc94ab944a0f4d50e143951a35263c05e
-size 2323644260

 version https://git-lfs.github.com/spec/v1
+oid sha256:08b45d9e8f7f7d84c29e30e8aa80383597f9304b6d8612aa95eb64f753413542
+size 2323644132

hparams.yaml CHANGED Viewed

@@ -1,5 +1,5 @@
 activations: Tanh
-batch_size: 4
 class_identifier: regression_metric
 dropout: 0.1
 encoder_learning_rate: 1.5e-05
@@ -8,18 +8,21 @@ final_activation: null
 hidden_sizes:
 - 3072
 - 1024
-keep_embeddings_frozen: true
 layer: mix
-layer_norm: false
-layer_transformation: sparsemax
 layerwise_decay: 0.95
 learning_rate: 1.5e-05
 loss: mse
 nr_frozen_epochs: 0.3
 optimizer: AdamW
 pool: avg
 pretrained_model: xlm-roberta-large
-train_data:
-    - train_all.csv
-validation_data:
-    - test_set.csv

 activations: Tanh
+batch_size: 8
 class_identifier: regression_metric
 dropout: 0.1
 encoder_learning_rate: 1.5e-05
 hidden_sizes:
 - 3072
 - 1024
+keep_embeddings_frozen: false
 layer: mix
+layer_norm: true
+layer_transformation: softmax
 layerwise_decay: 0.95
 learning_rate: 1.5e-05
+load_pretrained_weights: true
+local_files_only: false
 loss: mse
 nr_frozen_epochs: 0.3
 optimizer: AdamW
 pool: avg
 pretrained_model: xlm-roberta-large
+train_data:
+- train.csv
+validation_data:
+- test.csv
+warmup_steps: 0