main.py

import argparse
import os 
import torch
import torch.nn as nn
from torchvision import transforms
from torch.utils.data import DataLoader
from torchvision import models
import torchvision.datasets as datasets
import matplotlib.pyplot as plt
import numpy as np 
import shutil
from torchnet import meter
import seaborn as sn
import pandas as pd 


trainingErrors = []
testErrors = []
validationErrors = []

def main(doAugs, split, lr, model):

    global trainingErrors, testErrors, validationErrors


    try:
        shutil.rmtree("./graphs")
    except FileNotFoundError:
        pass    

    os.mkdir("./graphs")

    print("Using model: {}".format(model))
    print("Using data augmentation: {}".format(doAugs))
    print("Using split: {}".format(split))
    print("Learning rate: {}".format(lr))
    print("Number of epochs: 100")


    loadingTrain, loadingVal, loadingTest = getDataLoaders(doAugs, split)

    n_classes = 5

    model = buildModel(model, n_classes)

    trainingTime(model, loadingTrain, loadingVal, lr)

    cMatrix = testingTime(model, loadingTest)


    makePlot(trainingErrors, "Training")
    makePlot(validationErrors, "Validation")


    doConfusionMatrix(cMatrix)


def doConfusionMatrix(cMatrix):
    cMatrix.normalized = True
    dataframe = pd.DataFrame(cMatrix.value(), ["Poodle", "German Shepherd", "Dalmatian", "St Bernard", "Pug"], ["Poodle", "German Shepherd", "Dalmatian", "St Bernard", "Pug"])
    plt.figure(figsize=(15,15))
    sn.set(font_scale=1.5)
    sn.heatmap(dataframe, annot=True, annot_kws={"size": 20}, fmt="g")
    plt.savefig("graphs/confusionMatrix.png")


def makePlot(errors, errorType):

    fig = plt.figure()
    ax = plt.axes()
    ax.plot(errors)

    plt.xlabel("Epochs")
    plt.ylabel("{} error".format(errorType))
    plt.title("Graph to show the {} error over epochs".format(errorType))
    plt.savefig("graphs/{}Graph.png".format(errorType))


def validatingTime(model, loadingVal):

    global validationErrors

    print("Validating...")
    model.eval()

    iterations = 0
    accuracy = 0
    valLoss = 0

    criterion = nn.CrossEntropyLoss()

    with torch.no_grad(): # Don't back propagate validation data
        for images, labels in loadingVal:

            images, labels = images.cuda(), labels.cuda()

            output = model(images)
            loss = criterion(output,labels) 
            valLoss = valLoss + loss.item()

            iterations = iterations + 1
            
            _, outputMax = torch.max(output, 1)
            accuracy += (outputMax == labels).sum().item()

        valLoss = valLoss / iterations
        print("\nValidation loss: {:.3f}".format(valLoss))
        validationErrors.append(valLoss)

        accuracy = accuracy / (iterations * 4)
        print("Validation accuracy: {:.3f}%".format(accuracy * 100))

    return valLoss


def testingTime(model, loadingTest):

    global testErrors

    cMatrix = meter.ConfusionMeter(5) #Number of classes

    print("="*50)
    print("Testing...")
    model.eval()

    iterations = 0
    accuracy = 0
    testLoss = 0

    criterion = nn.CrossEntropyLoss()

    with torch.no_grad(): # Don't back propagate test data
        for images, labels in loadingTest:

            images, labels = images.cuda(), labels.cuda()

            output = model(images)
            loss = criterion(output,labels) 
            testLoss = testLoss + loss.item()

            iterations = iterations + 1
            
            _, outputMax = torch.max(output, 1)
            accuracy += (outputMax == labels).sum().item()

            if len(output) == 4: #batch size = 4
                cMatrix.add(output.data.squeeze(), labels)


        testLoss = testLoss / iterations
        print("\nTest loss: {:.3f}".format(testLoss))
        testErrors.append(testLoss)

        accuracy = accuracy / (iterations * 4)
        print("Test accuracy: {:.3f}%".format(accuracy * 100))


    return cMatrix


def trainingTime(model, loadingTrain, loadingVal, lr):

    global trainingErrors

    print("="*50)
    print("Training...")

    criterion = nn.CrossEntropyLoss()

    optimizer = torch.optim.SGD(model.parameters(), lr=lr, momentum=0.5, weight_decay=0.001) # Momentum, weight decay and dampening defaulted to 0

    numberEpochs = 100

    for epoch in range(numberEpochs):
        print("-"*50)
        print("Epoch number: {}".format(epoch))

        model.train()

        epochLoss = 0 
        iterations = 0
        accuracy = 0

        for images, labels in loadingTrain:

            images, labels = images.cuda(), labels.cuda()

            optimizer.zero_grad()               # Resets the gradient 
            output = model(images)              # Number of images evaluated here = batch size
            loss = criterion(output,labels)     # Calculates the loss via cross entropy loss
            loss.backward()                     # Feeds the loss bachwards
            optimizer.step()                    # Runs SGD to update the weights with the gradients

            iterations = iterations + 1

            print("\rBatch loss: {:.3f}".format(loss.item()), end="", flush=True)
            epochLoss = epochLoss + loss.item()

            _, outputMax = torch.max(output, 1)
            accuracy += (outputMax == labels).sum().item()

            # if iterations == 10:
            #     break

        epochLoss = epochLoss / iterations
        print("\nEpoch loss: {:.3f}".format(epochLoss))
        trainingErrors.append(epochLoss)

        accuracy = accuracy / (iterations * 4)
        print("Training accuracy: {:.3f}%".format(accuracy * 100))

        validatingTime(model, loadingVal)

    
def buildModel(architecture, n_classes):

    if architecture == "alexnet":
        model = models.alexnet(pretrained=True)

    elif architecture == "vgg19":
        model = models.vgg19(pretrained=True)

    elif architecture == "resnet18":
        model = models.resnet18(pretrained=True)

    elif architecture == "resnet34":
        model = models.resnet34(pretrained=True)

    elif architecture == "resnet50":
        model = models.resnet50(pretrained=True)


    else:
        raise("Model not supported")


    #Replace the last fully connected layer with a linear layers
    if architecture=="alexnet" or architecture=="vgg19":
        for param in model.parameters():
            param.requires_grad = False
        # model.fc = nn.Linear(512, n_classes) # not a thing with these models

        lastLayers = list(model.classifier.children())[:-1]
        lastLayers.extend([nn.Linear(model.classifier[6].in_features, 5)])
        model.classifier = nn.Sequential(*lastLayers)
    else:
        for param in model.parameters():
            param.requires_grad = False
        num_features = model.fc.in_features
        model.fc = nn.Linear(num_features, n_classes)

    model.cuda() 

    return model


def getDataLoaders(doAugs, split):

    trainingFolder = os.path.join(os.getcwd(),"{}-{}-{}/trainingSet".format(split[0], split[1], split[2]))
    validationFolder = os.path.join(os.getcwd(),"{}-{}-{}/validationSet".format(split[0], split[1], split[2]))
    testFolder = os.path.join(os.getcwd(),"{}-{}-{}/testSet".format(split[0], split[1], split[2]))
    

    # From Stanford Cats and Dogs dataset...
    _mean = [0.485, 0.456, 0.406]
    _std = [0.229, 0.224, 0.225]


    trainTrans = transforms.Compose([
        transforms.Resize(256),
        transforms.RandomCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ColorJitter(.3, .3, .3),
        transforms.ToTensor(),
        transforms.Normalize(_mean, _std),
    ])


    sameSizeTrans = transforms.Compose([
        transforms.RandomResizedCrop(224),
        transforms.ToTensor(),
        transforms.Normalize(_mean, _std),
    ])


    datasetTrain = datasets.ImageFolder(trainingFolder, trainTrans if doAugs else sameSizeTrans)
    datasetVal = datasets.ImageFolder(validationFolder, sameSizeTrans)
    datasetTest = datasets.ImageFolder(testFolder, sameSizeTrans)


    loadingTrain = torch.utils.data.DataLoader(datasetTrain, batch_size=4, shuffle=True, num_workers=8)
    loadingVal = torch.utils.data.DataLoader(datasetVal, batch_size=4, shuffle=False, num_workers=8)
    loadingTest =  torch.utils.data.DataLoader(datasetTest, batch_size=4, shuffle=False, num_workers=8)

    return loadingTrain, loadingVal, loadingTest


if __name__ == '__main__':

    arguments = argparse.ArgumentParser()
    arguments.add_argument("--a", default=1, type=int, help="Do data augmentation 1 for Y, 0 for N")
    arguments.add_argument("--lr", default=0.01, type=float, help="Learning rate")
    arguments.add_argument("--mod", default="alexnet")
    arguments.add_argument("--s", default=80, type=int, help="Training split to use")
    arguments = arguments.parse_args()

    doAugs = True if arguments.a==1 else False
    split = [arguments.s,int((100-arguments.s)/2),int((100-arguments.s)/2)]

    main(doAugs, split, arguments.lr, arguments.mod)