fix json code style.

PaddlePaddle · Nov 10, 2022 · ae98cc8 · ae98cc8
1 parent ab288ff
commit ae98cc8
Show file tree

Hide file tree

Showing 7 changed files with 100,573 additions and 7 deletions.
diff --git a/paddlespeech/s2t/models/whisper/assets/gpt2/special_tokens_map.json b/paddlespeech/s2t/models/whisper/assets/gpt2/special_tokens_map.json
@@ -1 +1,5 @@
-{"bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "unk_token": "<|endoftext|>"}
+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}
diff --git a/paddlespeech/s2t/models/whisper/assets/gpt2/tokenizer_config.json b/paddlespeech/s2t/models/whisper/assets/gpt2/tokenizer_config.json
@@ -1 +1,10 @@
-{"unk_token": "<|endoftext|>", "bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "add_prefix_space": false, "model_max_length": 1024, "special_tokens_map_file": null, "name_or_path": "gpt2", "tokenizer_class": "GPT2Tokenizer"}
+{
+  "unk_token": "<|endoftext|>",
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "add_prefix_space": false,
+  "model_max_length": 1024,
+  "special_tokens_map_file": null,
+  "name_or_path": "gpt2",
+  "tokenizer_class": "GPT2Tokenizer"
+}
diff --git a/paddlespeech/s2t/models/whisper/assets/gpt2/vocab.json b/paddlespeech/s2t/models/whisper/assets/gpt2/vocab.json
diff --git a/paddlespeech/s2t/models/whisper/assets/multilingual/added_tokens.json b/paddlespeech/s2t/models/whisper/assets/multilingual/added_tokens.json
@@ -1 +1,3 @@
-{"<|endoftext|>": 50257}
+{
+  "<|endoftext|>": 50257
+}
diff --git a/paddlespeech/s2t/models/whisper/assets/multilingual/special_tokens_map.json b/paddlespeech/s2t/models/whisper/assets/multilingual/special_tokens_map.json
@@ -1 +1,5 @@
-{"bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "unk_token": "<|endoftext|>"}
+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}
diff --git a/paddlespeech/s2t/models/whisper/assets/multilingual/tokenizer_config.json b/paddlespeech/s2t/models/whisper/assets/multilingual/tokenizer_config.json
@@ -1 +1,32 @@
-{"unk_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "bos_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "eos_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "add_prefix_space": false, "model_max_length": 1024, "special_tokens_map_file": null, "name_or_path": "multilingual", "errors": "replace", "tokenizer_class": "GPT2Tokenizer"}
+{
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "add_prefix_space": false,
+  "model_max_length": 1024,
+  "special_tokens_map_file": null,
+  "name_or_path": "multilingual",
+  "errors": "replace",
+  "tokenizer_class": "GPT2Tokenizer"
+}
diff --git a/paddlespeech/s2t/models/whisper/assets/multilingual/vocab.json b/paddlespeech/s2t/models/whisper/assets/multilingual/vocab.json