Le modèle de langage le plus petit, entraîné sur 'Clem' et 'Creatrice'

Files changed (4) hide show

README.md CHANGED Viewed

@@ -37,7 +37,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 100
 ### Training results

 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 1000
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cacecec895ffd7fb16f4890bfb8ef11a2f6d242ef9165275c738b1a82118a650
 size 1840

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d076052677864c10a1e5a5b6ef9b4d632d8cc4c2539220cc658c05d90a06af9
 size 1840

runs/Nov16_09-54-19_338386517b02/events.out.tfevents.1763286860.338386517b02.4607.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5c82e4388960ecace23d8af43a25f4338fd1e747dbd0d2cff97a38fa9affed6
+size 215963

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fe43c06d2fe157c2ae6194edda7ac47a69200602b1db786c434e179a6eef9b08
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:b75e69500ce3d1ee7ebf5a384c02e67cf5e782c24e7b9645e22042d8ea7b5f49
 size 5905