facebookresearch · chenyangyu1988 · Dec 20, 2019
diff --git a/pytext/data/bert_tensorizer.py b/pytext/data/bert_tensorizer.py
@@ -240,8 +240,10 @@ def forward(
         return self.tensorize(tokens_2d, segment_labels_2d, seq_lens_1d, positions_2d)
 
     def torchscriptify(self):
-        # Don't need torchscriptified tokenizer during training
-        self.tokenizer = self.tokenizer.torchscriptify()
+        # tokenizer will only be used in Inference, so we hold its torchscriptify
+        # by end of the training.
+        if not isinstance(self.tokenizer, torch.jit.ScriptModule):
+            self.tokenizer = self.tokenizer.torchscriptify()
         return super().torchscriptify()
 
 

diff --git a/pytext/data/test/tensorizers_test.py b/pytext/data/test/tensorizers_test.py
@@ -822,16 +822,19 @@ def test_roberta_tensorizer(self):
             tokenizer=DoNothingTokenizer(),
             vocab=tensorizer.vocab,
             max_seq_len=tensorizer.max_seq_len,
-        ).torchscriptify()
+        )
+        script_tensorizer_impl = tensorizer_impl.torchscriptify()
         per_sentence_tokens = [tensorizer.tokenizer.tokenize(text)]
         tokens_2d, segment_labels_2d, seq_lens_1d, positions_2d = zip(
-            *[tensorizer_impl.numberize(per_sentence_tokens)]
+            *[script_tensorizer_impl.numberize(per_sentence_tokens)]
         )
-        script_tensors = tensorizer_impl.tensorize(
+        script_tensors = script_tensorizer_impl.tensorize(
             tokens_2d, segment_labels_2d, seq_lens_1d, positions_2d
         )
         for tensor, expect in zip(script_tensors, expected):
             self.assertEqual(tensor.tolist(), expect)
+        # test it is able to call torchscriptify multiple time
+        tensorizer_impl.torchscriptify()
 
 
 class SquadForRobertaTensorizerTest(unittest.TestCase):