[+] train loop scripts

2022-02-07 00:19:06 +03:00 · 2022-02-07 00:19:06 +03:00 · b6f9f63d83
parent 5f673d5a34
commit b6f9f63d83
3 changed files with 146 additions and 0 deletions
--- a/src/train/dataset.py
+++ b/src/train/dataset.py
@ -0,0 +1,50 @@
+import os
+import glob
+import cv2
+from pathlib import Path
+from typing import Callable, List, Optional, Tuple, Union, Dict
+
+import torch
+import torchvision
+from torch.utils.data import Dataset
+
+from src.train.trimap import makeTrimap
+
+class SegDataset(Dataset):
+    """A custom Dataset(torch.utils.data) implement three functions: __init__, __len__, and __getitem__.
+    Datasets are created from PTFDataModule.
+    """
+
+    def __init__(
+            self,
+            frame_dir: Union[str, Path],
+            mask_dir: Union[str, Path]
+    ) -> None:
+
+        self.frame_dir = Path(frame_dir)
+        self.mask_dir = Path(mask_dir)
+        self.image_names = glob.glob(f"{self.frame_dir}/*.jpg") 
+        self.mask_names = [os.path.join(self.mask_dir,"mask"+x.split('/')[-1][:-4][5:]+".png") for x in self.image_names] 
+        print(self.mask_names)
+        self.transform = torchvision.transforms.Compose([
+        torchvision.transforms.ToTensor(),
+        torchvision.transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])])
+
+
+    def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
+        frame_pth = self.image_names[index]
+        mask_pth = self.mask_names[index]
+
+        frame =  cv2.imread(frame_pth)
+        frame = self.transform(frame)
+
+        mask =  cv2.imread(mask_pth,cv2.IMREAD_GRAYSCALE)
+        trimap = torch.from_numpy(makeTrimap(mask)).float()
+        trimap =  torch.unsqueeze(trimap,0)
+        mask = torch.from_numpy(mask)
+        mask = torch.unsqueeze(mask,0).float()
+
+        return frame, trimap, mask
+
+    def __len__(self):
+        return len(self.image_names)
--- a/src/train/train.py
+++ b/src/train/train.py
@ -0,0 +1,80 @@
+import os
+import argparse
+import logging
+import logging.handlers
+
+import torch
+import torch.nn as nn
+
+import neptune.new as neptune
+
+from src.models.modnet import MODNet
+from src.trainer import supervised_training_iter
+from src.train.dataset import SegDataset
+
+logging.basicConfig(level=logging.DEBUG)
+logger = logging.getLogger(__name__)
+
+def parseArgs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--datasetPath', type=str, required=True, help='path to dataset')
+    parser.add_argument('--modelsPath', type=str, required=True, help='path to save trained MODNet models')
+    parser.add_argument('--pretrainedPath', type=str, help='path of pre-trained MODNet')
+    parser.add_argument('--startEpoch', type=int, default=-1, help='epoch to start with')
+    parser.add_argument('--batchCount', type=int, default=16, help='batches count')
+    args = parser.parse_args()
+    return args
+
+args = parseArgs()
+
+batch_size = args.batchCount
+lr = 0.01       # learn rate
+epochs = 40     # total epochs
+
+modnet = MODNet(backbone_pretrained=False)
+modnet = nn.DataParallel(modnet)
+
+if args.pretrainedPath is not None:
+    modnet.load_state_dict(
+        torch.load(args.pretrainedPath)
+    )
+
+optimizer = torch.optim.SGD(modnet.parameters(), lr=lr, momentum=0.9)
+lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=int(0.25 * epochs), gamma=0.1, last_epoch=args.startEpoch)
+
+dataset = SegDataset(os.path.join(args.datasetPath, "images"), os.path.join(args.datasetPath, "masks"))
+
+dataloader = torch.utils.data.DataLoader(
+    dataset,
+    batch_size=batch_size,
+    shuffle=True,
+    pin_memory=True
+)
+
+
+project = '<YOUR_WORKSPACE/YOUR_PROJECT>'
+api_token = '<YOURR_API_TOKEN>'
+neptuneRun = neptune.init(project = project, 
+                         api_token = api_token,
+                         source_files=[])
+
+for epoch in range(0, epochs):
+    for idx, (image, trimap, gt_matte) in enumerate(dataloader):
+        semantic_loss, detail_loss, matte_loss, semantic_iou = supervised_training_iter(modnet, optimizer, image, trimap, gt_matte, semantic_scale=1)
+        if idx % 100 == 0:
+            logger.info(f'idx: {idx}, semantic_loss: {semantic_loss:.5f}, detail_loss: {detail_loss:.5f}, matte_loss: {matte_loss:.5f}, semantic_iou: {semantic_iou:.5f}')
+    logger.info(f'Epoch: {epoch}, semantic_loss: {semantic_loss:.5f}, detail_loss: {detail_loss:.5f}, matte_loss: {matte_loss:.5f}, semantic_iou: {semantic_iou:.5f}')
+    
+    neptuneRun["training/epoch/semantic_loss"].log(semantic_loss)
+    neptuneRun["training/epoch/detail_loss"].log(detail_loss)
+    neptuneRun["training/epoch/matte_loss"].log(matte_loss)
+    neptuneRun["training/epoch/semantic_iou"].log(semantic_iou)
+
+    modelPath = os.path.join(args.modelsPath, f"model_epoch{epoch}.ckpt")
+    torch.save(modnet.state_dict(), modelPath)
+    logger.info(f"model saved to {modelPath}")
+    lr_scheduler.step()
+
+torch.save(modnet.state_dict(), os.path.join(args.modelsPath, "model.ckpt"))
+
+neptuneRun.stop()
--- a/src/train/trimap.py
+++ b/src/train/trimap.py
@ -0,0 +1,16 @@
+import numpy as np
+import cv2
+
+def makeEdgeMask(mask, width):
+    kernel = np.ones((width,width), np.uint8)
+
+    erosion = cv2.erode(mask, kernel, iterations = 1)
+    dilation = cv2.dilate(mask, kernel, iterations = 1)
+
+    return dilation - erosion
+
+def makeTrimap(mask, width = 5):
+   edgeMask = makeEdgeMask(mask, width)
+   trimap = mask.astype(np.float)
+   trimap[edgeMask == 1] = 0.5
+   return trimap