Upload 13 files

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -1,16 +1,16 @@
 {
-    "epoch": 10.0,
-    "eval_loss": 1.961527705192566,
-    "eval_runtime": 77.3959,
-    "eval_samples": 83311,
-    "eval_samples_per_second": 1076.426,
-    "eval_steps_per_second": 134.555,
-    "num_input_tokens_seen": 225160303,
-    "total_flos": 5.962942279994573e+16,
-    "train_loss": 1.8857571468166456,
-    "train_runtime": 16282.8843,
-    "train_samples": 333243,
-    "train_samples_per_second": 204.658,
-    "train_steps_per_second": 25.583,
-    "train_tokens_per_second": 13822.702
 }

 {
+    "epoch": 5.0,
+    "eval_loss": 1.0584163665771484,
+    "eval_runtime": 189.7324,
+    "eval_samples": 199905,
+    "eval_samples_per_second": 1053.616,
+    "eval_steps_per_second": 131.707,
+    "num_input_tokens_seen": 272407288,
+    "total_flos": 7.214188795055309e+16,
+    "train_loss": 0.0,
+    "train_runtime": 0.0544,
+    "train_samples": 799616,
+    "train_samples_per_second": 73478382.327,
+    "train_steps_per_second": 9184797.791,
+    "train_tokens_per_second": 5003948262.574
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 10.0,
-    "eval_loss": 1.961527705192566,
-    "eval_runtime": 77.3959,
-    "eval_samples": 83311,
-    "eval_samples_per_second": 1076.426,
-    "eval_steps_per_second": 134.555,
-    "num_input_tokens_seen": 225160303
 }

 {
+    "epoch": 5.0,
+    "eval_loss": 1.0584163665771484,
+    "eval_runtime": 189.7324,
+    "eval_samples": 199905,
+    "eval_samples_per_second": 1053.616,
+    "eval_steps_per_second": 131.707,
+    "num_input_tokens_seen": 272407288
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aac5f96b0d1c2435c122ac11eef69a78fde5924dbd76351f1a233d6c0f28037c
 size 309965092

 version https://git-lfs.github.com/spec/v1
+oid sha256:b3cface5fdffb425bbbd2773db70102ea5c6163b7a5ce463b7c4025890ae277a
 size 309965092

train_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-    "epoch": 10.0,
-    "num_input_tokens_seen": 225160303,
-    "total_flos": 5.962942279994573e+16,
-    "train_loss": 1.8857571468166456,
-    "train_runtime": 16282.8843,
-    "train_samples": 333243,
-    "train_samples_per_second": 204.658,
-    "train_steps_per_second": 25.583,
-    "train_tokens_per_second": 13822.702
 }

 {
+    "epoch": 5.0,
+    "num_input_tokens_seen": 272407288,
+    "total_flos": 7.214188795055309e+16,
+    "train_loss": 0.0,
+    "train_runtime": 0.0544,
+    "train_samples": 799616,
+    "train_samples_per_second": 73478382.327,
+    "train_steps_per_second": 9184797.791,
+    "train_tokens_per_second": 5003948262.574
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:742b6e553683f5a8be3739142255defff5d894b12172be0396ab15afd216cd8a
-size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:9143c94773d6b03b7764b406548e1c5333b9641259defab981c6cbbd20fb1eb7
+size 5560