Upload 9 files

Files changed (7) hide show

added_tokens.json ADDED Viewed

+{
+  "</t>": 50268,
+  "</y>": 50266,
+  "<t>": 50267,
+  "<y>": 50265
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc8b5e3df98c686cc4b229b8e809bb4fe5b23fefa2d0fcae0a83fc70d9d5a950
 size 498677429

 version https://git-lfs.github.com/spec/v1
+oid sha256:5e0a534ef949cb38e587d890ee909b7eb3fb2694f70c0d52e9399649f0c12829
 size 498677429

special_tokens_map.json ADDED Viewed

+{
+  "additional_special_tokens": [
+    "<y>",
+    "</y>",
+    "<t>",
+    "</t>"
+  ],
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "add_prefix_space": false,
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff