fix minor formatting issues

Ziad Al-Halah · Ziad Al-Halah · commit 05670fb07d5c · 2021-01-28T20:35:54.000-06:00
diff --git a/scripts/model_predict.py b/scripts/model_predict.py
@@ -32,25 +32,29 @@
 
   parser = argparse.ArgumentParser(formatter_class=argparse.ArgumentDefaultsHelpFormatter)
   # data
-  parser.add_argument('--image_dir', type=str, default=None, help='directory containing images')
-  parser.add_argument('--category_csv', type=str, default=None, help='csv file with category names')
-  parser.add_argument('--save_dir', type=str, default=None, help='save directory')
+  parser.add_argument('--image_dir', type=str, default=None,
+                      help='directory containing images')
+  parser.add_argument('--category_csv', type=str, default=None,
+                      help='csv file with category names')
+  parser.add_argument('--save_dir', type=str, default=None,
+                      help='save directory')
   # model
-  parser.add_argument('--model_file', type=str, default=None, help='model file path')
-  parser.add_argument('--batch_size', type=int, default=64, help='batch size for training')
+  parser.add_argument('--model_file', type=str, default=None,
+                      help='model file path')
+  parser.add_argument('--batch_size', type=int, default=64,
+                      help='batch size for training')
   parser.add_argument('--num_workers', type=int, default=0,
                       help='number of workers for data loader')
-  parser.add_argument('--seed', type=int, default=-1, help='set random seed')
-  parser.add_argument('--no_gpu', action='store_true', help='do not use GPUs')
+  parser.add_argument('--seed', type=int, default=-1,
+                      help='set random seed')
+  parser.add_argument('--no_gpu', action='store_true',
+                      help='do not use GPUs')
   parser.add_argument('--image_size', type=int, default=256,
                       help='image size for qualitative results')
   parser.add_argument('--predict_top_k', type=int, default=5,
                       help='number of top predictions to save to file')
   # logging
-  parser.add_argument(
-      '--log_level',
-      type=str,
-      default=logging.INFO)
+  parser.add_argument('--log_level', type=str, default=logging.INFO)
   parser.add_argument('--log_interval', type=int, default=100,
                       help='logging interval in terms of iterations')
 
@@ -108,8 +112,10 @@
 
   # create a dataset
   logger.info('Create a testing EmojiDataset')
-  test_ds = datasets.EmojiDataset(categories_list=categories_list, samples_csv_file=image_paths_file,
-                                  input_transform=image_transform, suppress_exceptions=True)
+  test_ds = datasets.EmojiDataset(categories_list=categories_list,
+                                  samples_csv_file=image_paths_file,
+                                  input_transform=image_transform,
+                                  suppress_exceptions=True)
   logger.info('Number of samples in testing file: {}'.format(test_ds.n_samples))
 
   # set batch collate
@@ -123,12 +129,11 @@
               torch.zeros(n_categories))])
   # create loaders
   logger.info('Create data loaders')
-  test_dataloader = torch.utils.data.DataLoader(
-      test_ds,
-      batch_size=opt.batch_size,
-      shuffle=False,
-      num_workers=opt.num_workers,
-      collate_fn=collate_fn)
+  test_dataloader = torch.utils.data.DataLoader(test_ds,
+                                                batch_size=opt.batch_size,
+                                                shuffle=False,
+                                                num_workers=opt.num_workers,
+                                                collate_fn=collate_fn)
 
   # model
   logger.info('=' * 25)
diff --git a/scripts/model_test.py b/scripts/model_test.py
@@ -32,23 +32,28 @@
 
   parser = argparse.ArgumentParser(formatter_class=argparse.ArgumentDefaultsHelpFormatter)
   # data
-  parser.add_argument('--test_csv', type=str, default=None, help='csv file with testing samples')
-  parser.add_argument('--category_csv', type=str, default=None, help='csv file with category names')
-  parser.add_argument('--save_dir', type=str, default=None, help='save directory')
+  parser.add_argument('--test_csv', type=str, default=None,
+                      help='csv file with testing samples')
+  parser.add_argument('--category_csv', type=str, default=None,
+                      help='csv file with category names')
+  parser.add_argument('--save_dir', type=str, default=None,
+                      help='save directory')
   # model
-  parser.add_argument('--model_file', type=str, default=None, help='model file path')
-  parser.add_argument('--batch_size', type=int, default=64, help='batch size for training')
-  parser.add_argument('--test_steps', type=int, default=-
-                      1, help='number of iterations on evaluation data for one epoch')
+  parser.add_argument('--model_file', type=str, default=None,
+                      help='model file path')
+  parser.add_argument('--batch_size', type=int, default=64,
+                      help='batch size for training')
+  parser.add_argument('--test_steps', type=int, default=-1,
+                      help='number of iterations on evaluation data for one epoch')
   parser.add_argument('--num_workers', type=int, default=0,
                       help='number of workers for data loader')
-  parser.add_argument('--seed', type=int, default=-1, help='set random seed')
-  parser.add_argument('--no_gpu', action='store_true', help='do not use GPUs')
+  parser.add_argument('--seed', type=int, default=-1,
+                      help='set random seed')
+  parser.add_argument('--no_gpu', action='store_true',
+                      help='do not use GPUs')
   # qualitative results
-  parser.add_argument(
-      '--no_qualitative',
-      action='store_true',
-      help='disable qualitative evaluation')
+  parser.add_argument('--no_qualitative', action='store_true',
+                      help='disable qualitative evaluation')
   parser.add_argument('--per_class_samples', type=int, default=20,
                       help='the number of most confident samples per class to visualize')
   parser.add_argument('--multilabel_samples', type=int, default=30,
@@ -58,10 +63,7 @@
   parser.add_argument('--image_size', type=int, default=256,
                       help='image size for qualitative results')
   # logging
-  parser.add_argument(
-      '--log_level',
-      type=str,
-      default=logging.INFO)
+  parser.add_argument('--log_level', type=str, default=logging.INFO)
   parser.add_argument('--log_interval', type=int, default=100,
                       help='logging interval in terms of iterations')
 
@@ -117,8 +119,11 @@
 
   # create a dataset
   logger.info('Create a testing EmojiDataset')
-  test_ds = datasets.EmojiDataset(categories_list=categories_list, samples_csv_file=opt.test_csv,
-                                  input_transform=image_transform, target_transform=label_transform, suppress_exceptions=True)
+  test_ds = datasets.EmojiDataset(categories_list=categories_list,
+                                  samples_csv_file=opt.test_csv,
+                                  input_transform=image_transform,
+                                  target_transform=label_transform,
+                                  suppress_exceptions=True)
   logger.info('Number of samples in testing file: {}'.format(test_ds.n_samples))
 
   # set batch collate
@@ -132,12 +137,11 @@
               torch.zeros(n_categories))])
   # create loaders
   logger.info('Create data loaders')
-  test_dataloader = torch.utils.data.DataLoader(
-      test_ds,
-      batch_size=opt.batch_size,
-      shuffle=False,
-      num_workers=opt.num_workers,
-      collate_fn=collate_fn)
+  test_dataloader = torch.utils.data.DataLoader(test_ds,
+                                                batch_size=opt.batch_size,
+                                                shuffle=False,
+                                                num_workers=opt.num_workers,
+                                                collate_fn=collate_fn)
 
   # model
   logger.info('=' * 25)
@@ -146,7 +150,9 @@
   logger.info('in checkpoint: {}'.format(checkpoint.keys()))
   model_name = checkpoint['opt'].net_name
   logger.info('model type: {}'.format(model_name))
-  model = nf.create_and_init_model(model_name, checkpoint['model_state'], output_size=n_categories)
+  model = nf.create_and_init_model(model_name,
+                                   checkpoint['model_state'],
+                                   output_size=n_categories)
   # check if there is a gpu
   device = torch.device('cuda' if torch.cuda.is_available() and not opt.no_gpu else 'cpu')
   logger.info('using device: {}'.format(device))
@@ -169,17 +175,13 @@
   metrics.add_default_eval_metrics(tester, max_k=n_categories - 1)
   if not opt.no_qualitative:
     logger.info('add qualitative metrics')
-    tester.add_metric(
-        'TopBPred',
-        metrics.TopBinaryPredictions(
-            n_samples=opt.per_class_samples),
-        eval=True)
-    tester.add_metric(
-        'TopMPred',
-        metrics.TopMultiLabelPredictions(
-            n_samples=opt.multilabel_samples,
-            k=opt.multilabel_k),
-        eval=True)
+    tester.add_metric('TopBPred',
+                      metrics.TopBinaryPredictions(n_samples=opt.per_class_samples),
+                      eval=True)
+    tester.add_metric('TopMPred',
+                      metrics.TopMultiLabelPredictions(n_samples=opt.multilabel_samples,
+                                                       k=opt.multilabel_k),
+                      eval=True)
 
   # testing
   epoch = checkpoint['epoch']
diff --git a/scripts/model_train.py b/scripts/model_train.py
@@ -33,10 +33,14 @@
 
   parser = argparse.ArgumentParser(formatter_class=argparse.ArgumentDefaultsHelpFormatter)
   # data
-  parser.add_argument('--train_csv', type=str, default=None, help='csv file with training samples')
-  parser.add_argument('--val_csv', type=str, default=None, help='csv file with validation samples')
-  parser.add_argument('--category_csv', default=None, type=str, help='csv file with category names')
-  parser.add_argument('--save_dir', default=None, type=str, help='save directory')
+  parser.add_argument('--train_csv', type=str, default=None,
+                      help='csv file with training samples')
+  parser.add_argument('--val_csv', type=str, default=None,
+                      help='csv file with validation samples')
+  parser.add_argument('--category_csv', default=None, type=str,
+                      help='csv file with category names')
+  parser.add_argument('--save_dir', default=None, type=str,
+                      help='save directory')
   # model
   parser = nf.add_model_parser_arguments(parser)
   # optim
@@ -47,49 +51,43 @@
   parser.add_argument('--scheduler_gamma', type=float, default=0.1,
                       help='multiplicative factor of learning rate decay')
 
-  parser.add_argument('--train_steps', type=int, default=-
-                      1, help='number of iterations on training data for one epoch')
+  parser.add_argument('--train_steps', type=int, default=-1,
+                      help='number of iterations on training data for one epoch')
   parser.add_argument('--train_epochs', type=int, default=1,
                       help='number of epochs on training data')
-  parser.add_argument(
-      '--train_layers_epochs',
-      type=int,
-      default=-1,
-      help='number of epochs to train selected layers before switching to training all layers')
-  parser.add_argument(
-      '--sampler_type',
-      type=str,
-      default='rnd',
-      choices=[
-          'rnd',
-          'wc_rnd',
-          'seq'],
-      help='type of the training data sampler')
-  parser.add_argument('--sampler_persistent', action='store_true', help='use a persistent sampler')
-  parser.add_argument('--start_epoch', type=int, default=1, help='index of the start epoch')
-  parser.add_argument('--input_aug', action='store_true', help='enable input augmentation')
-  parser.add_argument('--color_aug', action='store_true', help='enable color augmentation')
-  parser.add_argument('--batch_size', type=int, default=64, help='batch size for training')
-  parser.add_argument(
-      '--weighted_pos',
-      action='store_true',
-      help='weight positive samples for each class in balance with negatives')
+  parser.add_argument('--train_layers_epochs', type=int, default=-1,
+                      help='number of epochs to train selected layers before switching to training all layers')
+  parser.add_argument('--sampler_type', type=str, default='rnd',
+                      choices=['rnd', 'wc_rnd', 'seq'],
+                      help='type of the training data sampler')
+  parser.add_argument('--sampler_persistent', action='store_true',
+                      help='use a persistent sampler')
+  parser.add_argument('--start_epoch', type=int, default=1,
+                      help='index of the start epoch')
+  parser.add_argument('--input_aug', action='store_true',
+                      help='enable input augmentation')
+  parser.add_argument('--color_aug', action='store_true',
+                      help='enable color augmentation')
+  parser.add_argument('--batch_size', type=int, default=64,
+                      help='batch size for training')
+  parser.add_argument('--weighted_pos', action='store_true',
+                      help='weight positive samples for each class in balance with negatives')
   parser.add_argument('--weighted_pos_max', type=float, default=None,
                       help='maximum weight of positive samples for all class')
-  parser.add_argument('--eval_steps', type=int, default=-
-                      1, help='number of iterations on evaluation data for one epoch')
-  parser.add_argument('--eval_batch_size', type=int, default=128, help='batch size for evaluation')
+  parser.add_argument('--eval_steps', type=int, default=-1,
+                      help='number of iterations on evaluation data for one epoch')
+  parser.add_argument('--eval_batch_size', type=int, default=128,
+                      help='batch size for evaluation')
   parser.add_argument('--best_metric', type=str, default='AUC',
                       help='the evaluation metric used to select best model')
   parser.add_argument('--num_workers', type=int, default=0,
                       help='number of workers for data loader')
-  parser.add_argument('--seed', type=int, default=-1, help='set random seed')
-  parser.add_argument('--no_gpu', action='store_true', help='do not use GPUs')
+  parser.add_argument('--seed', type=int, default=-1,
+                      help='set random seed')
+  parser.add_argument('--no_gpu', action='store_true',
+                      help='do not use GPUs')
   # logging
-  parser.add_argument(
-      '--log_level',
-      type=str,
-      default=logging.INFO)
+  parser.add_argument('--log_level', type=str, default=logging.INFO)
   parser.add_argument('--log_interval', type=int, default=100,
                       help='logging interval in terms of iterations')
 
@@ -138,12 +136,18 @@
 
   # create a dataset
   logger.info('Create a training EmojiDataset')
-  train_ds = datasets.EmojiDataset(categories_list=categories_list, samples_csv_file=opt.train_csv,
-                                   input_transform=image_transform_train, target_transform=label_transform, suppress_exceptions=True)
+  train_ds = datasets.EmojiDataset(categories_list=categories_list,
+                                   samples_csv_file=opt.train_csv,
+                                   input_transform=image_transform_train,
+                                   target_transform=label_transform,
+                                   suppress_exceptions=True)
   logger.info('Number of samples in training file: {}'.format(train_ds.n_samples))
   logger.info('Create a validation EmojiDataset')
-  valid_ds = datasets.EmojiDataset(categories_list=categories_list, samples_csv_file=opt.val_csv,
-                                   input_transform=image_transform_eval, target_transform=label_transform, suppress_exceptions=True)
+  valid_ds = datasets.EmojiDataset(categories_list=categories_list,
+                                   samples_csv_file=opt.val_csv,
+                                   input_transform=image_transform_eval,
+                                   target_transform=label_transform,
+                                   suppress_exceptions=True)
   logger.info('Number of samples in validation file: {}'.format(valid_ds.n_samples))
 
   # create data samplers
@@ -174,10 +178,19 @@
               torch.zeros(n_categories))])
   # create loaders
   logger.info('Create data loaders')
-  train_dataloader = torch.utils.data.DataLoader(train_ds, sampler=train_sampler,
-                                                 batch_size=opt.batch_size, shuffle=False, num_workers=opt.num_workers, collate_fn=collate_fn)
-  eval_dataloader = torch.utils.data.DataLoader(valid_ds, sampler=valid_sampler,
-                                                batch_size=opt.eval_batch_size, shuffle=False, num_workers=opt.num_workers, collate_fn=collate_fn, drop_last=False)
+  train_dataloader = torch.utils.data.DataLoader(train_ds,
+                                                 sampler=train_sampler,
+                                                 batch_size=opt.batch_size,
+                                                 shuffle=False,
+                                                 num_workers=opt.num_workers,
+                                                 collate_fn=collate_fn)
+  eval_dataloader = torch.utils.data.DataLoader(valid_ds,
+                                                sampler=valid_sampler,
+                                                batch_size=opt.eval_batch_size,
+                                                shuffle=False,
+                                                num_workers=opt.num_workers,
+                                                collate_fn=collate_fn,
+                                                drop_last=False)
 
   # model
   logger.info('=' * 25)
@@ -198,7 +211,9 @@
   if opt.scheduler_step_size > 0:
     logger.info('setup learning rate scheduler')
     lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer,
-                                                   step_size=opt.scheduler_step_size, gamma=opt.scheduler_gamma, last_epoch=-1)
+                                                   step_size=opt.scheduler_step_size,
+                                                   gamma=opt.scheduler_gamma,
+                                                   last_epoch=-1)
 
   # Loss
   logger.info('setup loss')
@@ -279,7 +294,9 @@
       if trainer.lr_scheduler is not None:
         logger.info('reset scheduler')
         trainer.lr_scheduler = torch.optim.lr_scheduler.StepLR(trainer.optimizer,
-                                                               step_size=opt.scheduler_step_size, gamma=opt.scheduler_gamma, last_epoch=-1)
+                                                               step_size=opt.scheduler_step_size,
+                                                               gamma=opt.scheduler_gamma,
+                                                               last_epoch=-1)
 
   logger.info('Run time: {}'.format(datetime.now() - tm_start))
   if log_file is not None and os.path.exists(log_file):