main_local_global.py

import sklearn.preprocessing
from sklearn.metrics import roc_auc_score,roc_curve,auc,accuracy_score,precision_recall_fscore_support,confusion_matrix
import matplotlib.pyplot as plt
from torch import nn, softmax
from model.model_local_global import LGMF_GNN
from dataloader_local_global import dataloader_lg,prepare_local_dataloader
import torch.nn.functional as F
from opt import *
from utils.metrics import accuracy, auc, prf
from scipy.special import softmax
# from data.dataprocess import * #MDD
from data.dataprocess import * #ABIDE
# from Abide_2Dataload import dataloader
import random
import yaml
from torch.optim import lr_scheduler

with open(opt.config_filename) as f:
        config = yaml.load(f, Loader=yaml.Loader)
print(config)

if __name__ == '__main__':
    opt = OptInit().initialize()
    OptInit().print_args()
    print('  Loading dataset ...')
    local_dataloader,sub_IDs = prepare_local_dataloader(config['data']['time_seires'],config['data']['t1_root'])
    # 取出平衡后的ID
    if 'SRPBS' in config['data']['dataset']: 
        balanced_names = np.genfromtxt("D:\data\depression\sub_list\same_protocol_balanced_selected_by_error.txt", dtype=str)
    if 'MDD' in config['data']['dataset']: 
        balanced_names = np.genfromtxt("D:\data\depression\REST_meta_MDD\group\subject_IDs_selected.txt", dtype=str)
    if 'Anding' in config['data']['dataset']:
        balanced_names = np.genfromtxt("D:\data\depression\Anding\subject_IDs.txt", dtype=str)
    if 'All' in config['data']['dataset']: 
        balanced_names = np.genfromtxt("/data0/lsy/sub_list/SRPBS_and_MDD.txt", dtype=str)

    num_before = len(sub_IDs)
    sub_IDs = [name  for index,name in enumerate(sub_IDs) if name in balanced_names]
    assert len(sub_IDs) == num_before
    sub_IDs = np.array(sub_IDs)
    print('case num:',len(sub_IDs))
    
    dl = dataloader_lg()
    sub_IDs,y,nonimg,site_num,y_site = dl.load_data(subject_IDs=sub_IDs)
    n_sub = len(sub_IDs)
    # raw_features1,raw_features2是来自不同图谱的原始特征（连通性矩阵
    # y是onhot标签
    # nonimg是四维的表型特征
    # test_names = np.genfromtxt("/data0/lsy/sub_list/same_protocol_balanced_test.txt", dtype=str)
    # train_val_names = np.genfromtxt("/data0/lsy/sub_list/same_protocol_balanced_train.txt", dtype=str)
    # train_val_inds = [index  for index,name in enumerate(sub_IDs) if name in train_val_names]
    # test_ind = [index  for index,name in enumerate(sub_IDs) if name in test_names]
    # train_val_inds = np.array(train_val_inds)
    # test_ind = np.array(test_ind)
    unique_IDs = np.unique(sub_IDs,return_index=False)

    n_folds = 10
    train_inds,val_inds = dl.data_split(n_folds,train_val_num=len(unique_IDs))
    # print(cv_splits)
    global mean_tpr
    global mean_fpr
    mean_tpr = 0.0
    mean_fpr = np.linspace(0, 1, 100)
    global cnt
    cnt = 0
    corrects_val = np.zeros(n_folds, dtype=np.int32)
    accs_val = np.zeros(n_folds, dtype=np.float32)
    aucs_val = np.zeros(n_folds, dtype=np.float32)
    prfs_val = np.zeros([n_folds, 3], dtype=np.float32)

    corrects_test = np.zeros(n_folds, dtype=np.int32)
    accs_test = np.zeros(n_folds, dtype=np.float32)
    aucs_test = np.zeros(n_folds, dtype=np.float32)
    prfs_test = np.zeros([n_folds, 3], dtype=np.float32)

    best_accs_test = np.zeros(n_folds, dtype=np.float32)
    best_prfs_test = np.zeros([n_folds, 3], dtype=np.float32)

    opt.ckpt_path = os.path.join(opt.ckpt_path,opt.mode)


    for fold in range(5,n_folds):
        print("\r\n========================== Fold {} ==========================".format(fold))
        # train_val_ind = cv_splits[fold][0]
        # test_ind = cv_splits[fold][1]
        # random.shuffle(train_val_ind)
        # train_ind = train_val_ind[0:int(0.8*len(train_val_ind))]
        # val_ind = train_val_ind[int(0.8*len(train_val_ind)):]

        ### cv best
        train_name = unique_IDs[train_inds[fold]]
        val_name = unique_IDs[val_inds[fold]]
        test_name = val_name

        train_ind = [index  for index,name in enumerate(sub_IDs) if name in train_name]
        val_ind = [index  for index,name in enumerate(sub_IDs) if name in val_name]
        test_ind = val_ind
        np.save('ind.npy',{'train_ind':train_ind,'val_ind':val_ind})
        ### cv val
        # train_val_name = unique_IDs[train_inds[fold]]
        # test_name = unique_IDs[val_inds[fold]]

        # train_val_ind = [index  for index,name in enumerate(sub_IDs) if name in train_val_name]
        # test_ind = [index  for index,name in enumerate(sub_IDs) if name in test_name]
        # random.seed(123)
        # random.shuffle(train_val_ind)
        # val_ind = train_val_ind[int(0.8*len(train_val_ind)):]
        # train_ind = train_val_ind[0:int(0.8*len(train_val_ind))]


        wrong = [ind for ind in test_ind if ind in train_ind]
        print(wrong)

        ### out test
        # test_num = 115 # 127 old T1:48 new T1:70
        # train_ind = train_inds[fold]+test_num
        # val_ind = val_inds[fold]+test_num
        # test_ind = [i for i in range(test_num)]

        # train_ind = train_val_inds[train_inds[fold]]
        # test_ind = test_ind
        # val_ind = train_val_inds[val_inds[fold]]

        # print('train_ind:',train_ind)
        # print('test_ind:',test_ind)
        # print('val_ind',val_ind)
        print('train HC:MDD =',sum(y[train_ind]==0),':',sum(y[train_ind]==1))
        print('val HC:MDD =',sum(y[val_ind]==0),':',sum(y[val_ind]==1))
        print('test HC:MDD =',sum(y[test_ind]==0),':',sum(y[test_ind]==1))
        train_HC_ind = np.array([ind for ind in np.argwhere(y==1) if ind in train_ind])
        train_MDD_ind = np.array([ind for ind in np.argwhere(y==0) if ind in train_ind])


        if torch.cuda.is_available():
            torch.cuda.manual_seed(n_folds)

        np.random.seed(n_folds)  # Numpy module.
        random.seed(n_folds)

        config['train']["seq_len"] = config['data']['window_width']

        model = LGMF_GNN(nonimg,
                         site_num = site_num,
                         roi_num = config['train']['node_size'],
                         local_fea_dim = config['train']['node_size'],
                         global_fea_dim = config['train']['node_size']*config['model']['embedding_size'],# opt.node_feature_dim, # sum = GNNpredictor embeddim  scat = GNNpredictor embeddim *nROI
                        #  global_fea_dim = opt.node_feature_dim, # sum
                         timeseries_len = config['train']["seq_len"],
                         local_dataloader = local_dataloader,
                         train_HC_ind=train_HC_ind,
                         train_MDD_ind=train_MDD_ind)
        model = model.to(opt.device)

        # build loss, optimizer, metric
        loss_fn = torch.nn.CrossEntropyLoss()
        if opt.optimizer=='Adam':
            optimizer = torch.optim.Adam(model.parameters(), lr=opt.lr, weight_decay=opt.wd)
            optimizer_L = torch.optim.Adam(model.local_gnn.parameters(), lr=1e-3, weight_decay=opt.wd)
            optimizer_G = torch.optim.Adam([param for name, param in model.named_parameters() if 'local_gnn' not in name], lr=opt.lr, weight_decay=opt.wd)
        if opt.optimizer=='RMSprop':
            optimizer = torch.optim.RMSprop(model.parameters(),lr=opt.lr,weight_decay=opt.wd)
        # scheduler = lr_scheduler.StepLR(optimizer_G, step_size=opt.stepsize, gamma=opt.gamma)
        scheduler = lr_scheduler.StepLR(optimizer, step_size=opt.stepsize, gamma=opt.gamma)

        labels = torch.as_tensor(y, dtype=torch.long).to(opt.device)
        # opt.ckpt_path = os.path.join(opt.ckpt_path,opt.mode)
        fold_model_path = opt.ckpt_path + "/fold{}.pth".format(fold)


        def plot_embedding(data, label, title):
            plt.figure()
            x_min, x_max = np.min(data, 0), np.max(data, 0)
            data = (data - x_min) / (x_max - x_min)
            p = [[0] for _ in range(10)]
            p2 = [[0] for _ in range(10)]
            for i in range(len(label)):
                if label[i] == 0:
                    p = plt.scatter(data[i, 0], data[i, 1], lw=0.1, c='#FFD700')#, alpha=0.8
                elif label[i] == 1:
                    p2 = plt.scatter(data[i, 0], data[i, 1], lw=0.1, c='#800080')
            plt.legend((p, p2), ('HC', 'MDD'))
            plt.savefig('./draw_figure/MDD/Result{:d}.png'.format(fold), dpi=600)

        def train():
            print("  Number of training samples %d" % len(train_ind))
            print("  Start training...\r\n")
            acc = 0
            best_k = 0
            for epoch in range(opt.num_iter):
                model.train()
                # optimaize together
                optimizer.zero_grad()
                # # cycle optimize
                # optimizer_G.zero_grad()
                # optimizer_L.zero_grad()

                scheduler.step()
                with torch.set_grad_enabled(True):
                    node_logits, att, emb1, com1, com2,com3, emb2,emb3,k_num,local_loss,local_site_loss,local_acc,local_site_acc = model.forward(dl,train_ind)
                    # node_logits, att, emb1, com1, com2,com3,com4, emb2,emb3,emb4 = model([features_cuda,features_cuda,features_cuda], sadj, fadj,fadj2,fadj3)
                    # print(sub_IDs[train_ind],labels[train_ind])
                    loss_class = loss_fn(node_logits[train_ind], labels[train_ind])
                    loss_dep = (loss_dependence(emb1, com1, n_sub)
                                + loss_dependence(emb2, com2, n_sub)
                                +loss_dependence(emb3, com3, n_sub)) / 3

                    # loss_com = common_loss4(com1, com2,com3,com4)
                    loss_com = common_loss3(com1, com2,com3)

                    loss = loss_class + 1e-12 * loss_dep + 0.00005 * loss_com  + 0.2 * local_loss
                    # loss = 5*loss_class + 1e-3 * loss_dep + 0.1*loss_com
                    # loss = loss_class + local_loss
                    # loss.backward()

                    ## optimize together
                    # print('optimize together')
                    loss = loss + local_site_loss
                    loss.backward()
                    optimizer.step()

                    ## cycle optimize
                    # print('cycle optimize')
                    # if epoch % 10 < 5:
                    #     # if epoch %10 ==0: loss = loss - torch.clip(local_site_loss,0,1)
                    #     # loss = loss - torch.clip(local_site_loss,0,1) # no grad reverse layer
                    #     loss = loss + local_site_loss
                    #     loss.backward()
                    #     optimizer_L.step()
                    # else:
                    #     loss.backward()
                    #     optimizer_G.step()
                correct_train, acc_train = accuracy(node_logits[train_ind].detach().cpu().numpy(), y[train_ind])

                model.eval()
                with torch.set_grad_enabled(False):

                    node_logits, att,emb1, com1, com2,com3, emb2,emb3,k_num,_,_,_,_ = model.forward(dl)
                    # node_logits, att,emb1, com1, com2,com3,com4, emb2,emb3,emb4 = model([features_cuda,features_cuda,features_cuda], sadj, fadj,fadj2,fadj3)
                # print(sub_IDs[val_ind],labels[val_ind])

                logits_test = node_logits[val_ind].detach().cpu().numpy()
                correct_test, acc_test = accuracy(logits_test, y[val_ind])
                # pos_probs = softmax(logits_test, axis=1)[:, 1]
                # pos_probs = logits_test[:, 1]
                # fpr,tpr,thresholds =roc_curve(pos_probs, y[test_ind])
                # auc_plot =roc_auc_score(pos_probs, y[test_ind])

                auc_test = auc(logits_test, y[val_ind])
                prf_test = prf(logits_test, y[val_ind])

                if epoch % 20 == 0:
                    pos_probs = softmax(logits_test, axis=1)[:, 1]
                    # pos_probs = logits_test[:, 1]
                    # fpr,tpr,thresholds =roc_curve(pos_probs, y[test_ind])
                    # auc_plot =roc_auc_score(pos_probs, y[test_ind])
                    fpr,tpr,thresholds =roc_curve(y[val_ind],pos_probs)
                    auc_plot =roc_auc_score( y[val_ind],pos_probs)
                    plt.plot(fpr,tpr)
                    plt.title("auc=%.4f"%(auc_plot))
                    plt.xlabel("False Positive Rate")
                    plt.ylabel("True Positive Rate")
                    plt.fill_between(fpr,tpr,where=(tpr>0),color='green',alpha=0.5)
                    # plt.show()
                    plt.draw()
                    if not os.path.exists('./fig/fold_%d'%(fold)):
                        os.makedirs('./fig/fold_%d'%(fold))
                    if epoch % 100 == 0:
                        plt.savefig('./fig/fold_%d/epoch_%d.png'%(fold,epoch))
                    plt.close()

                    for param_group in optimizer_G.param_groups:
                        current_lr=param_group['lr']
                    print("Epoch: {},\tce loss: {:.5f},\ttrain acc: {:.5f},\tval_acc:{:.5f},\tlr:{:.5f},\tlocal_acc:{:.5f},\tlocal_site_acc:{:.5f},\tlocal_cls_loss:{:.5f},\tlocal_site_loss:{:.5f},\tloss_class: {:.5f},\t\tloss_dep: {:.5f}, \tloss_com: {:.5f}".format(epoch, loss.item(), acc_train.item(),acc_test,current_lr,local_acc,local_site_acc,local_loss.item(),local_site_loss.item(),loss_class.item(),loss_dep.item(),loss_com.item()))
                    # print("\t\tloss_class: {:.5f}, \tloss_dep: {:.5f}, \tloss_com: {:.5f}".format(loss_class.item(),loss_dep.item(),loss_com.item()))
                if acc_test >= acc and epoch > 9:
                    acc = acc_test
                    correct = correct_test
                    aucs_val[fold] = auc_test
                    prfs_val[fold] = prf_test
                    best_k = k_num
                    if opt.ckpt_path != '':
                        if not os.path.exists(opt.ckpt_path):
                            # print("Checkpoint Directory does not exist! Making directory {}".format(opt.ckpt_path))
                            os.makedirs(opt.ckpt_path)
                        torch.save(model.state_dict(), fold_model_path)
                if epoch%20 == 0 and epoch>0:
                    if opt.ckpt_path != '':
                        if not os.path.exists(opt.ckpt_path):
                            # print("Checkpoint Directory does not exist! Making directory {}".format(opt.ckpt_path))
                            os.makedirs(opt.ckpt_path)
                        # torch.save(model.state_dict(), opt.ckpt_path + "/fold{}_{}.pth".format(fold,epoch))

            accs_val[fold] = acc
            corrects_val[fold] = correct
            print("\r\n => Fold {} val accuacry {:.5f},best knn num:{}".format(fold, acc,best_k))



        def evaluate():
            print("  Number of testing samples %d" % len(test_ind))
            print('  Start testing...')
            global cnt
            global mean_tpr
            model.load_state_dict(torch.load(fold_model_path))
            print('model loaded:',fold_model_path)
            # model.load_state_dict(model.state_dict(), opt.ckpt_path + "/fold{}_{}.pth".format(fold,40))
            # print('model loaded:',opt.ckpt_path + "/fold{}_{}.pth".format(fold,60))
            model.eval()
            # node_logits = model(features_cuda, edge_index, edgenet_input)
            # node_logits, att, emb1, com1, com2,com3, emb2, emb,emb3 = model(features_cuda, sadj, fadj,fadj2)
            node_logits, att,emb1, com1, com2,com3, emb2,emb3,_,_,_,_,_ = model.forward(dl)
            # node_logits, att,emb1, com1, com2,com3,com4, emb2,emb3,emb4 = model([features_cuda,features_cuda,features_cuda], sadj, fadj,fadj2,fadj3)


            logits_test = node_logits[test_ind].detach().cpu().numpy()
            preds_test = node_logits[test_ind].max(1)[1].detach().cpu().numpy()
            cm = confusion_matrix(y[test_ind].reshape(-1,1),preds_test.reshape(-1,1))
            corrects_test[fold], accs_test[fold] = accuracy(logits_test, y[test_ind])
            aucs_test[fold] = auc(logits_test, y[test_ind])
            prfs_test[fold] = prf(logits_test, y[test_ind])
            cnt += 1
            pos_probs = softmax(logits_test, axis=1)[:, 1]
            fpr, tpr, thresholds = roc_curve(y[test_ind], pos_probs)
            # best threshold
            maxindex = (tpr-fpr).tolist().index(max(tpr-fpr))
            best_threshold = thresholds[maxindex]
            result = np.zeros(pos_probs.shape)
            result[pos_probs>=best_threshold] = 1
            result[pos_probs<best_threshold] = 0
            best_acc = accuracy_score(y[test_ind],result)
            best_cm = confusion_matrix(y[test_ind].reshape(-1,1),result.reshape(-1,1))
            p,r,f,s = precision_recall_fscore_support(y[test_ind].reshape(-1,1),result.reshape(-1,1),average='binary')
            best_prfs_test[fold] = [p,r,f]
            best_accs_test[fold] = best_acc
            
            mean_tpr += np.interp(mean_fpr, fpr, tpr)
            mean_tpr[0] = 0.0
            roc_auc = sklearn.metrics.auc(fpr, tpr)
            lw = 2
            plt.plot(fpr, tpr, lw=lw, label='ROC fold {0:d} curve (area= {1:.2f})'.format(cnt, roc_auc))
            plt.title("auc=%.4f"%(roc_auc))
            plt.xlabel("False Positive Rate")
            plt.ylabel("True Positive Rate")
            plt.fill_between(fpr,tpr,where=(tpr>0),color='green',alpha=0.5)
            plt.draw()
            if not os.path.exists('./fig/fold_%d'%(fold)):
                os.makedirs('./fig/fold_%d'%(fold))
            plt.savefig('./fig/fold_%d/test.png'%(fold))
            plt.close()

            print(cm)
            print("  Fold {} test accuracy {:.5f},best test accuracy {:.5f}, AUC {:.5f}, best threshold {:.5f}".format(fold, accs_test[fold],best_acc, aucs_test[fold],best_threshold))
            print(best_cm)




        if opt.train == 1:
            train()
            evaluate()
        elif opt.train == 0:
            evaluate()

    # if opt.train == 1:
    #     print("\r\n========================== Finish train ==========================")
    #     n_samples = (len(val_ind)*n_folds)
    #     acc_nfold = np.sum(corrects_val) / (len(val_ind)*n_folds)
    #     print("=> Average val accuracy in {}-fold CV: {:.5f}".format(n_folds, acc_nfold))
    #     print("=> Average val AUC in {}-fold CV: {:.5f}".format(n_folds, np.mean(aucs_val)))
    #     se, sp, f1 = np.mean(prfs_val, axis=0)
    #     print("=> Average val sensitivity {:.5f}, specificity {:.5f}, F1-score {:.5f}".format(se, sp, f1))

    # print("\r\n========================== Finish test ==========================")
    # n_samples = (len(test_ind)*n_folds)
    # acc_nfold = np.sum(corrects_test) / (len(test_ind)*n_folds)
    # best_acc_nfold = np.mean(best_accs_test)
    # print("=> Average test accuracy in {}-fold CV: {:.5f}; Best test accuracy {:.5f}".format(n_folds, acc_nfold,best_acc_nfold))
    # print("=> Average test AUC in {}-fold CV: {:.5f}".format(n_folds, np.mean(aucs_test)))
    # se, sp, f1 = np.mean(prfs_test, axis=0)
    # print("=> Average test sensitivity {:.5f}, specificity {:.5f}, F1-score {:.5f}".format(se, sp, f1))
    # best_se, best_sp, best_f1 = np.mean(best_prfs_test, axis=0)
    # print("=> Best average test sensitivity {:.5f}, specificity {:.5f}, F1-score {:.5f}".format(best_se, best_sp, best_f1))
    if opt.train == 1:
        print("\r\n========================== Finish train ==========================")
        print(accs_val)
        print(aucs_val)
        print(prfs_val)
        n_samples = (len(val_ind)*n_folds)
        acc_nfold = np.sum(corrects_val) / (len(val_ind)*n_folds)
        print("=> Average val accuracy in {}-fold CV: {:.5f}({:.5f})".format(n_folds, acc_nfold,np.std(accs_val)))
        print("=> Average val accuracy in {}-fold CV: {:.5f}({:.5f})".format(n_folds, np.mean(accs_val),np.std(accs_val)))
        print("=> Average val AUC in {}-fold CV: {:.5f}({:.5f})".format(n_folds, np.mean(aucs_val),np.std(aucs_val)))
        se, sp, f1 = np.mean(prfs_val, axis=0)
        se_, sp_, f1_ = np.std(prfs_val, axis=0)
        print("=> Average val sensitivity {:.5f}({:.5f}), specificity {:.5f}({:.5f}), F1-score {:.5f}({:.5f})".format(se,se_, sp,sp_, f1,f1_))

    print("\r\n========================== Finish test ==========================")
    print(accs_test)
    print(aucs_test)
    print(prfs_test)
    n_samples = (len(test_ind)*n_folds)
    acc_nfold = np.sum(corrects_test) / (len(test_ind)*n_folds)
    best_acc_nfold = np.mean(best_accs_test)
    print("=> Average test accuracy in {}-fold CV: {:.5f}({:.5f}); Best test accuracy {:.5f}({:.5f})".format(n_folds, acc_nfold,np.std(accs_test),best_acc_nfold,np.std(best_accs_test)))
    print("=> Average test AUC in {}-fold CV: {:.5f}({:.5f})".format(n_folds, np.mean(aucs_test),np.std(aucs_test)))
    se, sp, f1 = np.mean(prfs_test, axis=0)
    se_, sp_, f1_ = np.std(prfs_test, axis=0)
    print("=> Average test sensitivity {:.5f}({:.5f}), specificity {:.5f}({:.5f}), F1-score {:.5f}({:.5f})".format(se,se_, sp,sp_, f1,f1_))
    best_se, best_sp, best_f1 = np.mean(best_prfs_test, axis=0)
    best_se_, best_sp_, best_f1_ = np.std(best_prfs_test, axis=0)
    print("=> Best average test sensitivity {:.5f}({:.5f}), specificity {:.5f}({:.5f}), F1-score {:.5f}({:.5f})".format(best_se,best_se_, best_sp,best_sp_, best_f1,best_f1_))