Le modèle de langage le plus petit, entraîné sur 'Clem' et 'Creatrice'

Files changed (4) hide show

README.md CHANGED Viewed

@@ -37,7 +37,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Training results

 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 100
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1acb67f7772192dcb0dd47a64ffef578d3c25cb26dbebbf28a37e1e8123dafc
 size 1840

 version https://git-lfs.github.com/spec/v1
+oid sha256:cacecec895ffd7fb16f4890bfb8ef11a2f6d242ef9165275c738b1a82118a650
 size 1840

runs/Nov16_09-49-50_338386517b02/events.out.tfevents.1763286631.338386517b02.4607.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9b0dbc6df9e8498076547ff7187cc1c39092e2e6101069fcab6af9f730c1f26
+size 26164

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06a127e0120f55a35e71e82effe4e813f11bb9c68fa007bf2e2506bd276f6669
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe43c06d2fe157c2ae6194edda7ac47a69200602b1db786c434e179a6eef9b08
 size 5905