Bugfix text-transformers.py (#170)

nreimers · web-flow · commit 14535ff0e353 · 2022-05-05T01:13:03.000Z
This proposal fixed two bugs:
1) The example did not run on the stsb task for GLUE, as you have the wrong if condition (it is always true). Changing `&gt;= 1` to `&gt; 1` fixes it.
2) The train data loader did not shuffle the dataset, which leads to quite a large performance drop for some datasets on glue. Adding shuffle=True to the train dataloader fixes it.
diff --git a/lightning_examples/text-transformers/text-transformers.py b/lightning_examples/text-transformers/text-transformers.py
@@ -99,7 +99,7 @@ def prepare_data(self):
         AutoTokenizer.from_pretrained(self.model_name_or_path, use_fast=True)
 
     def train_dataloader(self):
-        return DataLoader(self.dataset["train"], batch_size=self.train_batch_size)
+        return DataLoader(self.dataset["train"], batch_size=self.train_batch_size, shuffle=True)
 
     def val_dataloader(self):
         if len(self.eval_splits) == 1:
@@ -183,7 +183,7 @@ def validation_step(self, batch, batch_idx, dataloader_idx=0):
         outputs = self(**batch)
         val_loss, logits = outputs[:2]
 
-        if self.hparams.num_labels >= 1:
+        if self.hparams.num_labels > 1:
             preds = torch.argmax(logits, axis=1)
         elif self.hparams.num_labels == 1:
             preds = logits.squeeze()