From 206ba2b2952f4265f77279ef3f4e9aa84521e9c0 Mon Sep 17 00:00:00 2001
From: "ouyang,wenyu" <wenyuouyang@outlook.com>
Date: Tue, 26 Mar 2024 21:57:44 +0800
Subject: [PATCH] refactor all output interface; add evaluate script for sceua
 calibrated xaj

---
 hydromodel/datasets/data_postprocess.py       | 563 +++++++++++-------
 hydromodel/datasets/data_preprocess.py        |  41 +-
 hydromodel/models/gr4j.py                     |   3 +-
 hydromodel/models/model_dict.py               |   2 +-
 hydromodel/trainers/calibrate_ga.py           |   3 +-
 hydromodel/trainers/evaluate.py               | 258 ++++++++
 hydromodel/trainers/train_utils.py            | 399 -------------
 scripts/calibrate_xaj.py                      |  33 +-
 scripts/evaluate_xaj.py                       | 176 ++----
 ...stprocess4calibrate.py => post_process.py} |   8 +-
 test/test_data_postprocess.py                 |   2 +-
 test/test_show_results.py                     |  12 +-
 12 files changed, 728 insertions(+), 772 deletions(-)
 create mode 100644 hydromodel/trainers/evaluate.py
 delete mode 100644 hydromodel/trainers/train_utils.py
 rename scripts/{datapostprocess4calibrate.py => post_process.py} (95%)

diff --git a/hydromodel/datasets/data_postprocess.py b/hydromodel/datasets/data_postprocess.py
index cd7dd76..00412d2 100644
--- a/hydromodel/datasets/data_postprocess.py
+++ b/hydromodel/datasets/data_postprocess.py
@@ -1,261 +1,376 @@
+"""Show results of calibration and validation."""
 import os
+from matplotlib import pyplot as plt
 import numpy as np
 import pandas as pd
-import pathlib
 import spotpy
 
-from hydroutils import hydro_file
+from hydroutils import hydro_file, hydro_stat
 
-from hydromodel.models.model_config import MODEL_PARAM_DICT
-from hydromodel.models.xaj import xaj
 
+def plot_sim_and_obs(
+    date,
+    sim,
+    obs,
+    save_fig,
+    xlabel="Date",
+    ylabel=None,
+):
+    # matplotlib.use("Agg")
+    fig = plt.figure(figsize=(9, 6))
+    ax = fig.subplots()
+    ax.plot(
+        date,
+        sim,
+        color="black",
+        linestyle="solid",
+        label="Simulation",
+    )
+    ax.plot(
+        date,
+        obs,
+        "r.",
+        markersize=3,
+        label="Observation",
+    )
+    ax.set_xlabel(xlabel)
+    ax.set_ylabel(ylabel)
+    plt.legend(loc="upper right")
+    plt.tight_layout()
+    plt.savefig(save_fig, bbox_inches="tight")
+    # plt.cla()
+    plt.close()
 
-def read_save_sceua_calibrated_params(basin_id, save_dir, sceua_calibrated_file_name):
-    """
-    read the parameters' file generated by spotpy SCE-UA when finishing calibration
-
-    We also save the parameters of the best model run to a file
-
-    Parameters
-    ----------
-    basin_id
-        id of a basin
-    save_dir
-        the directory where we save params
-    sceua_calibrated_file_name
-        the parameters' file generated by spotpy SCE-UA when finishing calibration
-
-    Returns
-    -------
 
-    """
-    results = spotpy.analyser.load_csv_results(sceua_calibrated_file_name)
-    bestindex, bestobjf = spotpy.analyser.get_minlikeindex(
-        results
-    )  # 结果数组中具有最小目标函数的位置的索引
-    best_model_run = results[bestindex]
-    fields = [word for word in best_model_run.dtype.names if word.startswith("par")]
-    best_calibrate_params = pd.DataFrame(list(best_model_run[fields]))
-    save_file = os.path.join(save_dir, basin_id + "_calibrate_params.txt")
-    best_calibrate_params.to_csv(save_file, sep=",", index=False, header=True)
-    return np.array(best_calibrate_params).reshape(1, -1)  # 返回一列最佳的结果
+def plot_train_iteration(likelihood, save_fig):
+    # matplotlib.use("Agg")
+    fig = plt.figure(figsize=(9, 6))
+    ax = fig.subplots()
+    ax.plot(likelihood)
+    ax.set_ylabel("RMSE")
+    ax.set_xlabel("Iteration")
+    plt.savefig(save_fig, bbox_inches="tight")
+    # plt.cla()
+    plt.close()
 
 
-def summarize_parameters(result_dir, model_info: dict):
+def show_sceua_cali_result(
+    sceua_calibrated_file,
+    warmup_length,
+    save_dir,
+    basin_id,
+    train_period,
+    result_unit="mm/hour",
+    basin_area=None,
+    prcp=None,
+):
     """
-    output parameters of all basins to one file
+    Plot all year result to see the effect of optimized parameters
 
     Parameters
     ----------
-    result_dir
-        the directory where we save results
-    model_name
-        the name of the model
+    sceua_calibrated_file
+        the result file saved after optimizing
+    basin_id
+        id of the basin
+    train_period
+        the period of training data
+    result_unit
+        the unit of result, default is mm/day, we will convert it to m3/s
+    basin_area
+        the area of the basin, its unit must be km2
 
     Returns
     -------
-
+    None
     """
-    path = pathlib.Path(result_dir)
-    all_basins_dirs = [file for file in path.iterdir() if file.is_dir()]
-    params = []
-    basin_ids = []
-    for basin_dir in all_basins_dirs:
-        basin_id = basin_dir.stem
-        columns = MODEL_PARAM_DICT[model_info["name"]]["param_name"]
-        params_txt = pd.read_csv(
-            os.path.join(basin_dir, basin_id + "_calibrate_params.txt")
-        )
-        params_df = pd.DataFrame(params_txt.values.T, columns=columns)
-        params.append(params_df)
-        basin_ids.append(basin_id)
-    params_dfs = pd.concat(params, axis=0)
-    params_dfs.index = basin_ids
-    print(params_dfs)
-    params_dfs_ = params_dfs.transpose()
-    params_csv_file = os.path.join(result_dir, "basins_params.csv")
-    params_dfs_.to_csv(params_csv_file, sep=",", index=True, header=True)
+    # Load the results gained with the sceua sampler, stored in SCEUA_xaj.csv
+    # results = []
+    # for chunk in pd.read_csv(sceua_calibrated_file, chunksize=100000 ):
+    #  results.append(chunk)
+    # results = pd.concat(results)
+    results = spotpy.analyser.load_csv_results(sceua_calibrated_file)  # 读取结果
+    # Plot how the objective function was minimized during sampling
+    if not os.path.exists(save_dir):  # 绘制采样过程中目标函数的最小化情况
+        os.makedirs(save_dir)
+    plot_train_iteration(
+        results["like1"],
+        os.path.join(save_dir, "train_iteration.png"),  # 绘制迭代中的RMSE
+    )
+    # Plot the best model run
+    # Find the run_id with the minimal objective function value
+    bestindex, bestobjf = spotpy.analyser.get_minlikeindex(
+        results
+    )  # 绘制最佳模型图并找到run—id
+    # Select best model run
+    best_model_run = results[bestindex]  # 选择最佳模型结果
+    # Filter results for simulation results #最佳模型模拟结果
+    fields = [word for word in best_model_run.dtype.names if word.startswith("sim")]
+    best_simulation = list(best_model_run[fields])
+    convert_unit_sim = units.convert_unit(
+        np.array(best_simulation).reshape(1, -1),
+        # np.array(list(map(float, best_simulation)), dtype=float).reshape(1, -1),
+        result_unit,
+        units.unit["streamflow"],
+        basin_area=basin_area,
+    )
+    convert_unit_obs = units.convert_unit(
+        np.array(spot_setup.evaluation()).reshape(1, -1),
+        result_unit,
+        units.unit["streamflow"],
+        basin_area=basin_area,
+    )
 
+    # save calibrated results of calibration period      #保存率定的结果
+    train_result_file = os.path.join(
+        save_dir,
+        "train_qsim_" + spot_setup.model["name"] + "_" + str(basin_id) + ".csv",
+    )
+    pd.DataFrame(convert_unit_sim.reshape(-1, 1)).to_csv(
+        train_result_file,
+        sep=",",
+        index=False,
+        header=False,
+    )
+    # calculation rmse、nashsutcliffe and bias for training period
+    stat_error = hydro_stat.stat_error(
+        convert_unit_obs,
+        convert_unit_sim,
+    )
+    print("Training Metrics:", basin_id, stat_error)
+    hydro_file.serialize_json_np(
+        stat_error, os.path.join(save_dir, "train_metrics.json")
+    )
 
-def renormalize_params(result_dir, model_info: dict):
-    path = pathlib.Path(result_dir)
-    all_basins_files = [file for file in path.iterdir() if file.is_dir()]
-    renormalization_params = []
-    basin_ids = []
-    for basin_dir in all_basins_files:
-        basin_id = basin_dir.stem
-        basin_ids.append(basin_id)
-        params = np.loadtxt(
-            os.path.join(basin_dir, basin_id + "_calibrate_params.txt")
-        )[1:].reshape(1, -1)
-        param_ranges = MODEL_PARAM_DICT[model_info["name"]]["param_range"]
-        xaj_params = [
-            (value[1] - value[0]) * params[:, i] + value[0]
-            for i, (key, value) in enumerate(param_ranges.items())
-        ]
-        xaj_params_ = np.array([x for j in xaj_params for x in j])
-        params_df = pd.DataFrame(xaj_params_.T)
-        renormalization_params.append(params_df)
-    renormalization_params_dfs = pd.concat(renormalization_params, axis=1)
-    renormalization_params_dfs.index = MODEL_PARAM_DICT[model_info["name"]][
-        "param_name"
+    # 循还画图
+    time = pd.read_excel(
+        "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/洪水率定时间.xlsx"
+    )
+    calibrate_starttime = pd.to_datetime("2012-06-10 0:00:00")
+    calibrate_endtime = pd.to_datetime("2019-12-31 23:00:00")
+    basin_area = float(basin_area)
+    best_simulation = [
+        x * (basin_area * 1000000 / 1000 / 3600) for x in best_simulation
     ]
-    renormalization_params_dfs.columns = basin_ids
-    print(renormalization_params_dfs)
-    params_csv_file = os.path.join(result_dir, "basins_renormalization_params.csv")
-    renormalization_params_dfs.to_csv(params_csv_file, sep=",", index=True, header=True)
-
-
-def summarize_metrics(result_dir, model_info: dict):
-    """
-    output all results' metrics of all basins to one file
+    obs = [x * (basin_area * 1000000 / 1000 / 3600) for x in spot_setup.evaluation()]
+    time["starttime"] = pd.to_datetime(time["starttime"])
+    time["endtime"] = pd.to_datetime(time["endtime"])
+    Prcp_list = []
+    W_obs_list = []
+    W_sim_list = []
+    W_bias_abs_list = []
+    W_bias_rela_list = []
+    Q_max_obs_list = []
+    Q_max_sim_list = []
+    Q_bias_rela_list = []
+    time_bias_list = []
+    DC_list = []
+    ID_list = []
+    for i, row in time.iterrows():
+        # for i in range(len(time)):
+        if row["starttime"] < calibrate_endtime:
+            # if(time["starttime",0]<calibrate_endtime):
+            start_num = (
+                row["starttime"]
+                - calibrate_starttime
+                - pd.Timedelta(hours=warmup_length)
+            ) / pd.Timedelta(hours=1)
+            end_num = (
+                row["endtime"] - calibrate_starttime - pd.Timedelta(hours=warmup_length)
+            ) / pd.Timedelta(hours=1)
+            start_period = (row["endtime"] - calibrate_starttime) / pd.Timedelta(
+                hours=1
+            )
+            end_period = (row["endtime"] - calibrate_starttime) / pd.Timedelta(hours=1)
+            start_period = int(start_period)
+            end_period = int(end_period)
+            start_num = int(start_num)
+            end_num = int(end_num)
+            t_range_train_changci = pd.date_range(
+                row["starttime"], row["endtime"], freq="H"
+            )
+            save_fig = os.path.join(save_dir, "train_results" + str(i) + ".png")
+            best_simulation_changci = best_simulation[start_num : end_num + 1]
+            plot_sim_and_obs(
+                t_range_train_changci,
+                best_simulation[start_num : end_num + 1],
+                obs[start_num : end_num + 1],
+                prcp[start_num : end_num + 1],
+                save_fig,
+            )
+            Prcp = sum(prcp[start_num : end_num + 1])
+            W_obs = (
+                sum(obs[start_num : end_num + 1]) * 3600 * 1000 / basin_area / 1000000
+            )
+            W_sim = sum(best_simulation_changci) * 3600 * 1000 / basin_area / 1000000
+            W_bias_abs = W_sim - W_obs
+            W_bias_rela = W_bias_abs / W_obs
+            Q_max_obs = np.max(obs[start_num : end_num + 1])
+            Q_max_sim = np.max(best_simulation_changci)
+            Q_bias_rela = (Q_max_sim - Q_max_obs) / Q_max_obs
+            t1 = np.argmax(best_simulation_changci)
+            t2 = np.argmax(obs[start_num : end_num + 1])
+            time_bias = t1 - t2
+            DC = NSE(obs[start_num : end_num + 1], best_simulation_changci)
+            ID = row["starttime"].strftime("%Y%m%d")
+            Prcp_list.append(Prcp)
+            W_obs_list.append(W_obs)
+            W_sim_list.append(W_sim)
+            W_bias_abs_list.append(W_bias_abs)
+            W_bias_rela_list.append(W_bias_rela)
+            Q_max_obs_list.append(Q_max_obs)
+            Q_max_sim_list.append(Q_max_sim)
+            Q_bias_rela_list.append(Q_bias_rela)
+            time_bias_list.append(time_bias)
 
-    Parameters
-    ----------
-    result_dir
-        the directory where we save results
-
-    Returns
-    -------
+            DC_list.append(DC)
+            ID_list.append(ID)
 
-    """
-    path = pathlib.Path(result_dir)
-    all_basins_files = [file for file in path.iterdir() if file.is_dir()]
-    train_metrics = {}
-    test_metrics = {}
-    count = 0
-    basin_ids = []
-    for basin_dir in all_basins_files:
-        basin_id = basin_dir.stem
-        basin_ids.append(basin_id)
-        train_metric_file = os.path.join(basin_dir, "train_metrics.json")
-        test_metric_file = os.path.join(basin_dir, "test_metrics.json")
-        train_metric = hydro_file.unserialize_json(train_metric_file)
-        test_metric = hydro_file.unserialize_json(test_metric_file)
-
-        for key, value in train_metric.items():
-            if count == 0:
-                train_metrics[key] = value
-            else:
-                train_metrics[key] = train_metrics[key] + value
-        for key, value in test_metric.items():
-            if count == 0:
-                test_metrics[key] = value
-            else:
-                test_metrics[key] = test_metrics[key] + value
-        count = count + 1
-    metric_dfs_train = pd.DataFrame(train_metrics, index=basin_ids).transpose()
-    metric_dfs_test = pd.DataFrame(test_metrics, index=basin_ids).transpose()
-    metric_file_train = os.path.join(result_dir, "basins_metrics_train.csv")
-    metric_file_test = os.path.join(result_dir, "basins_metrics_test.csv")
-    metric_dfs_train.to_csv(metric_file_train, sep=",", index=True, header=True)
-    metric_dfs_test.to_csv(metric_file_test, sep=",", index=True, header=True)
-
-
-def save_streamflow(result_dir, model_info: dict, fold: int):
-    path = pathlib.Path(result_dir)
-    all_basins_files = [file for file in path.iterdir() if file.is_dir()]
-    streamflow_test = []
-    streamflow_train = []
-    basin_ids = []
-    for basin_dir in all_basins_files:
-        basin_id = basin_dir.stem
-        basin_ids.append(basin_id)
-        streamflow_df_test = pd.read_csv(
-            os.path.join(
-                basin_dir, "test_qsim_" + model_info["name"] + "_" + basin_id + ".csv"
-            ),
-            header=None,
-        )
-        streamflow_df_train = pd.read_csv(
-            os.path.join(
-                basin_dir, "train_qsim_" + model_info["name"] + "_" + basin_id + ".csv"
-            ),
-            header=None,
+    bias = pd.DataFrame(
+        {
+            "Prcp(mm)": Prcp_list,
+            "W_obs(mm)": W_obs_list,
+            "W_sim(mm)": W_sim_list,
+            "W_bias_abs": W_bias_abs_list,
+            "W_bias_rela": W_bias_rela_list,
+            "Q_max_obs(m3/s)": Q_max_obs_list,
+            "Q_max_sim(m3/s)": Q_max_sim_list,
+            "Q_bias_rela": Q_bias_rela_list,
+            "time_bias": time_bias_list,
+            "DC": DC_list,
+            "ID": ID_list,
+        }
+    )
+    bias.to_csv(
+        os.path.join(
+            "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/train_metrics.csv"
         )
-        streamflow_test.append(streamflow_df_test)
-        streamflow_train.append(streamflow_df_train)
-    streamflow_dfs_test = pd.concat(streamflow_test, axis=1)
-    streamflow_dfs_train = pd.concat(streamflow_train, axis=1)
-    streamflow_dfs_test.columns = basin_ids
-    streamflow_dfs_train.columns = basin_ids
-    test_info_file = path.parent.joinpath("data_info_fold" + str(fold) + "_test.json")
-    test_info = hydro_file.unserialize_json(test_info_file)
-    date_test = test_info["time"][-streamflow_dfs_test.shape[0] :]
-    streamflow_dfs_test.index = date_test
-    train_info_file = path.parent.joinpath("data_info_fold" + str(fold) + "_train.json")
-    train_info = hydro_file.unserialize_json(train_info_file)
-    date_train = train_info["time"][-streamflow_dfs_train.shape[0] :]
-    streamflow_dfs_train.index = date_train
-    eva_csv_file_test = os.path.join(result_dir, "basin_qsim_test.csv")
-    eva_csv_file_train = os.path.join(result_dir, "basin_qsim_train.csv")
-    streamflow_dfs_test.to_csv(eva_csv_file_test)
-    streamflow_dfs_train.to_csv(eva_csv_file_train)
+    )
+    t_range_train = pd.to_datetime(train_period[warmup_length:]).values.astype(
+        "datetime64[h]"
+    )
+    save_fig = os.path.join(save_dir, "train_results.png")  # 生成结果图
+    plot_sim_and_obs(t_range_train, best_simulation, obs, prcp[:], save_fig)
 
 
-def read_and_save_et_ouputs(result_dir, fold: int):
-    prameter_file = os.path.join(result_dir, "basins_params.csv")
-    param_values = pd.read_csv(prameter_file, index_col=0)
-    basins_id = param_values.columns.values
-    args_file = os.path.join(result_dir, "args.json")
-    args = hydro_file.unserialize_json(args_file)
-    warmup_length = args["warmup_length"]
-    model_func_param = args["model"]
-    exp_dir = pathlib.Path(result_dir).parent
-    data_info_train = hydro_file.unserialize_json(
-        exp_dir.joinpath(f"data_info_fold{fold}_train.json")
+def show_test_result(basin_id, test_date, qsim, obs, save_dir):
+    stat_error = hydro_stat.stat_error(obs.reshape(1, -1), qsim.reshape(1, -1))
+    print("Test Metrics:", basin_id, stat_error)
+    hydro_file.serialize_json_np(
+        stat_error, os.path.join(save_dir, "test_metrics.json")
     )
-    data_info_test = hydro_file.unserialize_json(
-        exp_dir.joinpath(f"data_info_fold{fold}_test.json")
+    time = pd.read_excel(
+        "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/洪水率定时间.xlsx"
     )
-    train_period = data_info_train["time"]
-    test_period = data_info_test["time"]
-    # TODO: basins_lump_p_pe_q_fold NAME need to be unified
-    train_np_file = os.path.join(exp_dir, f"data_info_fold{fold}_train.npy")
-    test_np_file = os.path.join(exp_dir, f"data_info_fold{fold}_test.npy")
-    # train_np_file = os.path.join(exp_dir, f"basins_lump_p_pe_q_fold{fold}_train.npy")
-    # test_np_file = os.path.join(exp_dir, f"basins_lump_p_pe_q_fold{fold}_test.npy")
-    train_data = np.load(train_np_file)
-    test_data = np.load(test_np_file)
-    es_test = []
-    es_train = []
-    for i in range(len(basins_id)):
-        _, e_train = xaj(
-            train_data[:, :, 0:2],
-            param_values[basins_id[i]].values.reshape(1, -1),
-            warmup_length=warmup_length,
-            **model_func_param,
-        )
-        _, e_test = xaj(
-            test_data[:, :, 0:2],
-            param_values[basins_id[i]].values.reshape(1, -1),
-            warmup_length=warmup_length,
-            **model_func_param,
-        )
-        es_train.append(e_train.flatten())
-        es_test.append(e_test.flatten())
-    df_e_train = pd.DataFrame(
-        np.array(es_train).T, columns=basins_id, index=train_period[warmup_length:]
+    test_starttime = pd.to_datetime("2020-01-01 00:00:00")
+    test_endtime = pd.to_datetime("2022-08-31 23:00:00")
+    # for i in range(len(time)):
+    #     if(test_starttime<time.iloc[i,0]<test_endtime):
+    #             start_num = (time.iloc[i,0]-test_starttime-pd.Timedelta(hours=warmup_length))/pd.Timedelta(hours=1)
+    #             end_num = (time.iloc[i,1]-test_starttime-pd.Timedelta(hours=warmup_length))/pd.Timedelta(hours=1)
+    #             start_period = (time.iloc[i,0]-test_starttime)/pd.Timedelta(hours=1)
+    #             end_period = (time.iloc[i,1]-test_starttime)/pd.Timedelta(hours=1)
+    #             start_period = int(start_period)
+    #             end_period = int(end_period)
+    #             start_num = int(start_num)
+    #             end_num = int(end_num)
+    #             t_range_test_changci = pd.to_datetime(test_date[start_period:end_period]).values.astype("datetime64[h]")
+    #             save_fig = os.path.join(save_dir, "test_results"+str(i)+".png")
+    #             plot_sim_and_obs(t_range_test_changci, qsim.flatten()[start_num:end_num],obs.flatten()[start_num:end_num], prcp[start_num:end_num],save_fig)
+    Prcp_list = []
+    W_obs_list = []
+    W_sim_list = []
+    W_bias_abs_list = []
+    W_bias_rela_list = []
+    Q_max_obs_list = []
+    Q_max_sim_list = []
+    Q_bias_rela_list = []
+    time_bias_list = []
+    DC_list = []
+    ID_list = []
+    for i, row in time.iterrows():
+        if test_starttime < row["starttime"] < test_endtime:
+            start_num = (
+                row["starttime"] - test_starttime - pd.Timedelta(hours=warmup_length)
+            ) / pd.Timedelta(hours=1)
+            end_num = (
+                row["endtime"] - test_starttime - pd.Timedelta(hours=warmup_length)
+            ) / pd.Timedelta(hours=1)
+            start_period = (row["endtime"] - test_starttime) / pd.Timedelta(hours=1)
+            end_period = (row["endtime"] - test_starttime) / pd.Timedelta(hours=1)
+            start_period = int(start_period)
+            end_period = int(end_period)
+            start_num = int(start_num)
+            end_num = int(end_num)
+            t_range_train_changci = pd.date_range(
+                row["starttime"], row["endtime"], freq="H"
+            )
+            save_fig = os.path.join(save_dir, "test_results" + str(i) + ".png")
+            plot_sim_and_obs(
+                t_range_train_changci,
+                qsim.flatten()[start_num : end_num + 1],
+                obs.flatten()[start_num : end_num + 1],
+                prcp[start_num : end_num + 1],
+                save_fig,
+            )
+            Prcp = sum(prcp[start_num : end_num + 1])
+            W_obs = sum(obs.flatten()[start_num : end_num + 1])
+            W_sim = sum(qsim.flatten()[start_num : end_num + 1])
+            W_bias_abs = W_sim - W_obs
+            W_bias_rela = W_bias_abs / W_obs
+            Q_max_obs = np.max(obs[start_num : end_num + 1])
+            Q_max_sim = np.max(qsim.flatten()[start_num : end_num + 1])
+            Q_bias_rela = (Q_max_sim - Q_max_obs) / Q_max_obs
+            t1 = np.argmax(qsim.flatten()[start_num : end_num + 1])
+            t2 = np.argmax(obs[start_num : end_num + 1])
+            time_bias = t1 - t2
+            DC = NSE(
+                obs.flatten()[start_num : end_num + 1],
+                qsim.flatten()[start_num : end_num + 1],
+            )
+            ID = row["starttime"].strftime("%Y%m%d")
+            Prcp_list.append(Prcp)
+            W_obs_list.append(W_obs)
+            W_sim_list.append(W_sim)
+            W_bias_abs_list.append(W_bias_abs)
+            W_bias_rela_list.append(W_bias_rela)
+            Q_max_obs_list.append(Q_max_obs)
+            Q_max_sim_list.append(Q_max_sim)
+            Q_bias_rela_list.append(Q_bias_rela)
+            time_bias_list.append(time_bias)
+            DC_list.append(DC)
+            ID_list.append(ID)
+
+    bias = pd.DataFrame(
+        {
+            "Prcp(mm)": Prcp_list,
+            "W_obs(mm)": W_obs_list,
+            "W_sim(mm)": W_sim_list,
+            "W_bias_abs": W_bias_abs_list,
+            "W_bias_rela": W_bias_rela_list,
+            "Q_max_obs(m3/s)": Q_max_obs_list,
+            "Q_max_sim(m3/s)": Q_max_sim_list,
+            "Q_bias_rela": Q_bias_rela_list,
+            "time_bias": time_bias_list,
+            "DC": DC_list,
+            "ID": ID_list,
+        }
     )
-    df_e_test = pd.DataFrame(
-        np.array(es_test).T, columns=basins_id, index=test_period[warmup_length:]
+    bias.to_csv(
+        os.path.join(
+            "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/test_metrics.csv"
+        )
     )
-    etsim_train_save_path = os.path.join(result_dir, "basin_etsim_train.csv")
-    etsim_test_save_path = os.path.join(result_dir, "basin_etsim_test.csv")
-    df_e_train.to_csv(etsim_train_save_path)
-    df_e_test.to_csv(etsim_test_save_path)
 
+    save_fig = os.path.join(save_dir, "test_results.png")
 
-if __name__ == "__main__":
-    one_model_one_hyperparam_setting_dir = os.path.join(
-        "/home/ldaning/code/biye/hydro-model-xaj/hydromodel/example/model_run_wuxi7"
-        # definitions.ROOT_DIR,
-        # "hydromodel",
-        # "example",
-        # "exp61561",
-        # "Dec08_11-38-48_LAPTOP-DNQOPPMS_fold1_HFsourcesrep1000ngs1000",
+    plot_sim_and_obs(
+        test_date[365:],
+        qsim.flatten(),
+        obs.flatten(),
+        prcp[:],
+        save_fig,
     )
-    read_and_save_et_ouputs(one_model_one_hyperparam_setting_dir, fold=0)
     # summarize_parameters(one_model_one_hyperparam_setting_dir, {"name": "xaj_mz"})
     # renormalize_params(one_model_one_hyperparam_setting_dir, {"name":"xaj_mz"})
     # summarize_metrics(one_model_one_hyperparam_setting_dir,{"name":"xaj_mz"})
diff --git a/hydromodel/datasets/data_preprocess.py b/hydromodel/datasets/data_preprocess.py
index 266efb5..de9673a 100644
--- a/hydromodel/datasets/data_preprocess.py
+++ b/hydromodel/datasets/data_preprocess.py
@@ -1,7 +1,7 @@
 """
 Author: Wenyu Ouyang
 Date: 2022-10-25 21:16:22
-LastEditTime: 2024-03-26 19:18:29
+LastEditTime: 2024-03-26 21:20:18
 LastEditors: Wenyu Ouyang
 Description: preprocess data for models in hydro-model-xaj
 FilePath: \hydro-model-xaj\hydromodel\datasets\data_preprocess.py
@@ -390,6 +390,22 @@ def cross_valid_data(ts_data, period, warmup, cv_fold, freq="1D"):
     return train_test_data
 
 
+def get_basin_area(data_type, data_dir, basin_ids):
+    area_name = remove_unit_from_name(AREA_NAME)
+    if data_type == "camels":
+        camels_data_dir = os.path.join(
+            SETTING["local_data_path"]["datasets-origin"], "camels", data_dir
+        )
+        camels = Camels(camels_data_dir)
+        basin_area = camels.read_area(basin_ids)
+    elif data_type == "owndata":
+        attr_data = xr.open_dataset(
+            os.path.join(os.path.dirname(data_dir), "attributes.nc")
+        )
+        basin_area = attr_data[area_name].values
+    return basin_area
+
+
 def get_ts_from_diffsource(data_type, data_dir, periods, basin_ids):
     """Get time series data from different sources and unify the format and unit of streamflow.
 
@@ -417,7 +433,7 @@ def get_ts_from_diffsource(data_type, data_dir, periods, basin_ids):
     prcp_name = remove_unit_from_name(PRCP_NAME)
     pet_name = remove_unit_from_name(PET_NAME)
     flow_name = remove_unit_from_name(FLOW_NAME)
-    area_name = remove_unit_from_name(AREA_NAME)
+    basin_area = get_basin_area(data_type, data_dir, basin_ids)
     if data_type == "camels":
         camels_data_dir = os.path.join(
             SETTING["local_data_path"]["datasets-origin"], "camels", data_dir
@@ -426,7 +442,6 @@ def get_ts_from_diffsource(data_type, data_dir, periods, basin_ids):
         ts_data = camels.read_ts_xrdataset(
             basin_ids, periods, ["prcp", "PET", "streamflow"]
         )
-        basin_area = camels.read_area(basin_ids)
         # trans unit to mm/day
         qobs_ = ts_data[["streamflow"]]
         target_unit = ts_data["prcp"].attrs.get("units", "unknown")
@@ -439,10 +454,6 @@ def get_ts_from_diffsource(data_type, data_dir, periods, basin_ids):
         ts_data = xr.open_dataset(
             os.path.join(os.path.dirname(data_dir), "timeseries.nc")
         )
-        attr_data = xr.open_dataset(
-            os.path.join(os.path.dirname(data_dir), "attributes.nc")
-        )
-        basin_area = attr_data[area_name].values
         target_unit = ts_data[prcp_name].attrs.get("units", "unknown")
         qobs_ = ts_data[[flow_name]]
         r_mmd = streamflow_unit_conv(qobs_, basin_area, target_unit=target_unit)
@@ -478,3 +489,19 @@ def get_pe_q_from_ts(ts_xr_dataset):
     qobs = np.expand_dims(ts_xr_dataset[flow_name].to_numpy().transpose(1, 0), axis=2)
 
     return p_and_e, qobs
+
+
+def cross_val_split_tsdata(
+    data_type, data_dir, cv_fold, train_period, test_period, periods, warmup, basin_ids
+):
+    ts_data = get_ts_from_diffsource(data_type, data_dir, periods, basin_ids)
+    if cv_fold <= 1:
+        # no cross validation
+        periods = np.sort(
+            [train_period[0], train_period[1], test_period[0], test_period[1]]
+        )
+        train_and_test_data = split_train_test(ts_data, train_period, test_period)
+    else:
+        # cross validation
+        train_and_test_data = cross_valid_data(ts_data, periods, warmup, cv_fold)
+    return train_and_test_data
diff --git a/hydromodel/models/gr4j.py b/hydromodel/models/gr4j.py
index e5a324a..8fd492e 100644
--- a/hydromodel/models/gr4j.py
+++ b/hydromodel/models/gr4j.py
@@ -1,10 +1,9 @@
 import math
 from typing import Optional, Tuple
-
 import numpy as np
 from numba import jit
-from hydromodel.models.model_config import MODEL_PARAM_DICT
 
+from hydromodel.models.model_config import MODEL_PARAM_DICT
 from hydromodel.models.xaj import uh_conv
 
 
diff --git a/hydromodel/models/model_dict.py b/hydromodel/models/model_dict.py
index 938b1e0..c9ca70c 100644
--- a/hydromodel/models/model_dict.py
+++ b/hydromodel/models/model_dict.py
@@ -1,7 +1,7 @@
 """
 Author: Wenyu Ouyang
 Date: 2024-03-23 08:25:49
-LastEditTime: 2024-03-26 18:11:44
+LastEditTime: 2024-03-26 20:41:22
 LastEditors: Wenyu Ouyang
 Description: LOSS_DICT and MODEL_DICT
 FilePath: \hydro-model-xaj\hydromodel\models\model_dict.py
diff --git a/hydromodel/trainers/calibrate_ga.py b/hydromodel/trainers/calibrate_ga.py
index 708f09e..213c130 100644
--- a/hydromodel/trainers/calibrate_ga.py
+++ b/hydromodel/trainers/calibrate_ga.py
@@ -20,9 +20,10 @@
 from hydroutils import hydro_file, hydro_stat
 
 
+from datasets.data_postprocess import plot_sim_and_obs
 from hydromodel.models.model_config import MODEL_PARAM_DICT
 from hydromodel.models.model_dict import MODEL_DICT, rmse43darr
-from hydromodel.trainers.train_utils import plot_sim_and_obs, plot_train_iteration
+from datasets.data_postprocess import plot_train_iteration
 
 
 def evaluate(individual, x_input, y_true, warmup_length, model):
diff --git a/hydromodel/trainers/evaluate.py b/hydromodel/trainers/evaluate.py
new file mode 100644
index 0000000..188f66b
--- /dev/null
+++ b/hydromodel/trainers/evaluate.py
@@ -0,0 +1,258 @@
+"""
+Author: Wenyu Ouyang
+Date: 2022-10-25 21:16:22
+LastEditTime: 2024-03-26 21:52:05
+LastEditors: Wenyu Ouyang
+Description: Plots for calibration and testing results
+FilePath: \hydro-model-xaj\hydromodel\trainers\evaluate.py
+Copyright (c) 2021-2022 Wenyu Ouyang. All rights reserved.
+"""
+
+import pathlib
+import pandas as pd
+import os
+import numpy as np
+import xarray as xr
+import spotpy
+
+from hydroutils import hydro_file
+from hydrodata.utils.utils import streamflow_unit_conv
+
+from hydromodel.datasets import FLOW_NAME, remove_unit_from_name
+from hydromodel.datasets.data_preprocess import get_basin_area
+from hydromodel.models.model_config import MODEL_PARAM_DICT
+from hydromodel.models.xaj import xaj
+
+
+def read_save_sceua_calibrated_params(basin_id, save_dir, sceua_calibrated_file_name):
+    """
+    read the parameters' file generated by spotpy SCE-UA when finishing calibration
+
+    We also save the parameters of the best model run to a file
+
+    Parameters
+    ----------
+    basin_id
+        id of a basin
+    save_dir
+        the directory where we save params
+    sceua_calibrated_file_name
+        the parameters' file generated by spotpy SCE-UA when finishing calibration
+
+    Returns
+    -------
+
+    """
+    results = spotpy.analyser.load_csv_results(sceua_calibrated_file_name)
+    bestindex, bestobjf = spotpy.analyser.get_minlikeindex(
+        results
+    )  # 结果数组中具有最小目标函数的位置的索引
+    best_model_run = results[bestindex]
+    fields = [word for word in best_model_run.dtype.names if word.startswith("par")]
+    best_calibrate_params = pd.DataFrame(list(best_model_run[fields]))
+    save_file = os.path.join(save_dir, basin_id + "_calibrate_params.txt")
+    best_calibrate_params.to_csv(save_file, sep=",", index=False, header=True)
+    return np.array(best_calibrate_params).reshape(1, -1)  # 返回一列最佳的结果
+
+
+def read_all_basin_params(basins, save_dir):
+    params_list = []
+    for basin_id in basins:
+        db_name = os.path.join(save_dir, basin_id)
+        # 读取每个流域的参数
+        basin_params = read_save_sceua_calibrated_params(basin_id, save_dir, db_name)
+        # 确保basin_params是一维的
+        basin_params = basin_params.flatten()
+        params_list.append(basin_params)
+    return np.vstack(params_list)
+
+
+def convert_streamflow_units(test_data, qsim, data_type, data_dir):
+    times = test_data["time"].data
+    basins = test_data["basin"].data
+    flow_name = remove_unit_from_name(FLOW_NAME)
+    flow_dataarray = xr.DataArray(
+        qsim.squeeze(-1), coords=[("time", times), ("basin", basins)], name=flow_name
+    )
+    flow_dataarray.attrs["units"] = test_data[flow_name].attrs["units"]
+    ds = xr.Dataset()
+    ds[flow_name] = flow_dataarray
+    target_unit = "m^3/s"
+    basin_area = get_basin_area(data_type, data_dir, basins)
+    ds_simflow = streamflow_unit_conv(
+        ds, basin_area, target_unit=target_unit, inverse=True
+    )
+    ds_obsflow = streamflow_unit_conv(
+        test_data[[flow_name]], basin_area, target_unit=target_unit, inverse=True
+    )
+    return ds_simflow, ds_obsflow
+
+
+def summarize_parameters(result_dir, model_name, basin_ids):
+    """
+    output parameters of all basins to one file
+
+    Parameters
+    ----------
+    result_dir
+        the directory where we save results
+    model_name
+        the name of the model
+
+    Returns
+    -------
+
+    """
+    params = []
+    for basin_id in basin_ids:
+        columns = MODEL_PARAM_DICT[model_name]["param_name"]
+        params_txt = pd.read_csv(
+            os.path.join(result_dir, basin_id + "_calibrate_params.txt")
+        )
+        params_df = pd.DataFrame(params_txt.values.T, columns=columns)
+        params.append(params_df)
+    params_dfs = pd.concat(params, axis=0)
+    params_dfs.index = basin_ids
+    print(params_dfs)
+    params_dfs_ = params_dfs.transpose()
+    params_csv_file = os.path.join(result_dir, "basins_params.csv")
+    params_dfs_.to_csv(params_csv_file, sep=",", index=True, header=True)
+
+
+def renormalize_params(result_dir, model_name, basin_ids):
+    renormalization_params = []
+    for basin_id in basin_ids:
+        params = np.loadtxt(
+            os.path.join(result_dir, basin_id + "_calibrate_params.txt")
+        )[1:].reshape(1, -1)
+        param_ranges = MODEL_PARAM_DICT[model_name]["param_range"]
+        xaj_params = [
+            (value[1] - value[0]) * params[:, i] + value[0]
+            for i, (key, value) in enumerate(param_ranges.items())
+        ]
+        xaj_params_ = np.array([x for j in xaj_params for x in j])
+        params_df = pd.DataFrame(xaj_params_.T)
+        renormalization_params.append(params_df)
+    renormalization_params_dfs = pd.concat(renormalization_params, axis=1)
+    renormalization_params_dfs.index = MODEL_PARAM_DICT[model_name]["param_name"]
+    renormalization_params_dfs.columns = basin_ids
+    print(renormalization_params_dfs)
+    params_csv_file = os.path.join(result_dir, "basins_renormalization_params.csv")
+    renormalization_params_dfs.to_csv(params_csv_file, sep=",", index=True, header=True)
+
+
+def summarize_metrics(result_dir, model_info: dict):
+    """
+    output all results' metrics of all basins to one file
+
+    Parameters
+    ----------
+    result_dir
+        the directory where we save results
+
+    Returns
+    -------
+
+    """
+    path = pathlib.Path(result_dir)
+    all_basins_files = [file for file in path.iterdir() if file.is_dir()]
+    train_metrics = {}
+    test_metrics = {}
+    count = 0
+    basin_ids = []
+    for basin_dir in all_basins_files:
+        basin_id = basin_dir.stem
+        basin_ids.append(basin_id)
+        train_metric_file = os.path.join(basin_dir, "train_metrics.json")
+        test_metric_file = os.path.join(basin_dir, "test_metrics.json")
+        train_metric = hydro_file.unserialize_json(train_metric_file)
+        test_metric = hydro_file.unserialize_json(test_metric_file)
+
+        for key, value in train_metric.items():
+            if count == 0:
+                train_metrics[key] = value
+            else:
+                train_metrics[key] = train_metrics[key] + value
+        for key, value in test_metric.items():
+            if count == 0:
+                test_metrics[key] = value
+            else:
+                test_metrics[key] = test_metrics[key] + value
+        count = count + 1
+    metric_dfs_train = pd.DataFrame(train_metrics, index=basin_ids).transpose()
+    metric_dfs_test = pd.DataFrame(test_metrics, index=basin_ids).transpose()
+    metric_file_train = os.path.join(result_dir, "basins_metrics_train.csv")
+    metric_file_test = os.path.join(result_dir, "basins_metrics_test.csv")
+    metric_dfs_train.to_csv(metric_file_train, sep=",", index=True, header=True)
+    metric_dfs_test.to_csv(metric_file_test, sep=",", index=True, header=True)
+
+
+def save_evaluate_results(result_dir, model_name, qsim, qobs, obs_ds):
+    ds = xr.Dataset()
+
+    # 添加 qsim 和 qobs
+    ds["qsim"] = qsim["flow"]
+    ds["qobs"] = qobs["flow"]
+
+    # 添加 prcp 和 pet
+    ds["prcp"] = obs_ds["prcp"]
+    ds["pet"] = obs_ds["pet"]
+
+    # 保存为 .nc 文件
+    file_path = os.path.join(result_dir, f"{model_name}_evaluation_results.nc")
+    ds.to_netcdf(file_path)
+
+    print(f"Results saved to: {file_path}")
+
+
+def read_and_save_et_ouputs(result_dir, fold: int):
+    prameter_file = os.path.join(result_dir, "basins_params.csv")
+    param_values = pd.read_csv(prameter_file, index_col=0)
+    basins_id = param_values.columns.values
+    args_file = os.path.join(result_dir, "args.json")
+    args = hydro_file.unserialize_json(args_file)
+    warmup_length = args["warmup_length"]
+    model_func_param = args["model"]
+    exp_dir = pathlib.Path(result_dir).parent
+    data_info_train = hydro_file.unserialize_json(
+        exp_dir.joinpath(f"data_info_fold{fold}_train.json")
+    )
+    data_info_test = hydro_file.unserialize_json(
+        exp_dir.joinpath(f"data_info_fold{fold}_test.json")
+    )
+    train_period = data_info_train["time"]
+    test_period = data_info_test["time"]
+    # TODO: basins_lump_p_pe_q_fold NAME need to be unified
+    train_np_file = os.path.join(exp_dir, f"data_info_fold{fold}_train.npy")
+    test_np_file = os.path.join(exp_dir, f"data_info_fold{fold}_test.npy")
+    # train_np_file = os.path.join(exp_dir, f"basins_lump_p_pe_q_fold{fold}_train.npy")
+    # test_np_file = os.path.join(exp_dir, f"basins_lump_p_pe_q_fold{fold}_test.npy")
+    train_data = np.load(train_np_file)
+    test_data = np.load(test_np_file)
+    es_test = []
+    es_train = []
+    for i in range(len(basins_id)):
+        _, e_train = xaj(
+            train_data[:, :, 0:2],
+            param_values[basins_id[i]].values.reshape(1, -1),
+            warmup_length=warmup_length,
+            **model_func_param,
+        )
+        _, e_test = xaj(
+            test_data[:, :, 0:2],
+            param_values[basins_id[i]].values.reshape(1, -1),
+            warmup_length=warmup_length,
+            **model_func_param,
+        )
+        es_train.append(e_train.flatten())
+        es_test.append(e_test.flatten())
+    df_e_train = pd.DataFrame(
+        np.array(es_train).T, columns=basins_id, index=train_period[warmup_length:]
+    )
+    df_e_test = pd.DataFrame(
+        np.array(es_test).T, columns=basins_id, index=test_period[warmup_length:]
+    )
+    etsim_train_save_path = os.path.join(result_dir, "basin_etsim_train.csv")
+    etsim_test_save_path = os.path.join(result_dir, "basin_etsim_test.csv")
+    df_e_train.to_csv(etsim_train_save_path)
+    df_e_test.to_csv(etsim_test_save_path)
diff --git a/hydromodel/trainers/train_utils.py b/hydromodel/trainers/train_utils.py
deleted file mode 100644
index b6a42db..0000000
--- a/hydromodel/trainers/train_utils.py
+++ /dev/null
@@ -1,399 +0,0 @@
-"""
-Author: Wenyu Ouyang
-Date: 2022-10-25 21:16:22
-LastEditTime: 2024-03-26 18:20:57
-LastEditors: Wenyu Ouyang
-Description: Plots for calibration and testing results
-FilePath: \hydro-model-xaj\hydromodel\trainers\train_utils.py
-Copyright (c) 2021-2022 Wenyu Ouyang. All rights reserved.
-"""
-
-from matplotlib import pyplot as plt
-import spotpy
-import pandas as pd
-import os
-import numpy as np
-
-from hydroutils import hydro_file, hydro_stat
-
-
-def plot_sim_and_obs(
-    date,
-    sim,
-    obs,
-    save_fig,
-    xlabel="Date",
-    ylabel=None,
-):
-    # matplotlib.use("Agg")
-    fig = plt.figure(figsize=(9, 6))
-    ax = fig.subplots()
-    ax.plot(
-        date,
-        sim,
-        color="black",
-        linestyle="solid",
-        label="Simulation",
-    )
-    ax.plot(
-        date,
-        obs,
-        "r.",
-        markersize=3,
-        label="Observation",
-    )
-    ax.set_xlabel(xlabel)
-    ax.set_ylabel(ylabel)
-    plt.legend(loc="upper right")
-    plt.tight_layout()
-    plt.savefig(save_fig, bbox_inches="tight")
-    # plt.cla()
-    plt.close()
-
-
-def plot_train_iteration(likelihood, save_fig):
-    # matplotlib.use("Agg")
-    fig = plt.figure(figsize=(9, 6))
-    ax = fig.subplots()
-    ax.plot(likelihood)
-    ax.set_ylabel("RMSE")
-    ax.set_xlabel("Iteration")
-    plt.savefig(save_fig, bbox_inches="tight")
-    # plt.cla()
-    plt.close()
-
-
-def show_calibrate_result(
-    sceua_calibrated_file,
-    warmup_length,
-    save_dir,
-    basin_id,
-    train_period,
-    result_unit="mm/hour",
-    basin_area=None,
-    prcp=None,
-):
-    """
-    Plot all year result to see the effect of optimized parameters
-
-    Parameters
-    ----------
-    sceua_calibrated_file
-        the result file saved after optimizing
-    basin_id
-        id of the basin
-    train_period
-        the period of training data
-    result_unit
-        the unit of result, default is mm/day, we will convert it to m3/s
-    basin_area
-        the area of the basin, its unit must be km2
-
-    Returns
-    -------
-    None
-    """
-    # Load the results gained with the sceua sampler, stored in SCEUA_xaj.csv
-    # results = []
-    # for chunk in pd.read_csv(sceua_calibrated_file, chunksize=100000 ):
-    #  results.append(chunk)
-    # results = pd.concat(results)
-    results = spotpy.analyser.load_csv_results(sceua_calibrated_file)  # 读取结果
-    # Plot how the objective function was minimized during sampling
-    if not os.path.exists(save_dir):  # 绘制采样过程中目标函数的最小化情况
-        os.makedirs(save_dir)
-    plot_train_iteration(
-        results["like1"],
-        os.path.join(save_dir, "train_iteration.png"),  # 绘制迭代中的RMSE
-    )
-    # Plot the best model run
-    # Find the run_id with the minimal objective function value
-    bestindex, bestobjf = spotpy.analyser.get_minlikeindex(
-        results
-    )  # 绘制最佳模型图并找到run—id
-    # Select best model run
-    best_model_run = results[bestindex]  # 选择最佳模型结果
-    # Filter results for simulation results #最佳模型模拟结果
-    fields = [word for word in best_model_run.dtype.names if word.startswith("sim")]
-    best_simulation = list(best_model_run[fields])
-    convert_unit_sim = units.convert_unit(
-        np.array(best_simulation).reshape(1, -1),
-        # np.array(list(map(float, best_simulation)), dtype=float).reshape(1, -1),
-        result_unit,
-        units.unit["streamflow"],
-        basin_area=basin_area,
-    )
-    convert_unit_obs = units.convert_unit(
-        np.array(spot_setup.evaluation()).reshape(1, -1),
-        result_unit,
-        units.unit["streamflow"],
-        basin_area=basin_area,
-    )
-
-    # save calibrated results of calibration period      #保存率定的结果
-    train_result_file = os.path.join(
-        save_dir,
-        "train_qsim_" + spot_setup.model["name"] + "_" + str(basin_id) + ".csv",
-    )
-    pd.DataFrame(convert_unit_sim.reshape(-1, 1)).to_csv(
-        train_result_file,
-        sep=",",
-        index=False,
-        header=False,
-    )
-    # calculation rmse、nashsutcliffe and bias for training period
-    stat_error = hydro_stat.stat_error(
-        convert_unit_obs,
-        convert_unit_sim,
-    )
-    print("Training Metrics:", basin_id, stat_error)
-    hydro_file.serialize_json_np(
-        stat_error, os.path.join(save_dir, "train_metrics.json")
-    )
-
-    # 循还画图
-    time = pd.read_excel(
-        "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/洪水率定时间.xlsx"
-    )
-    calibrate_starttime = pd.to_datetime("2012-06-10 0:00:00")
-    calibrate_endtime = pd.to_datetime("2019-12-31 23:00:00")
-    basin_area = float(basin_area)
-    best_simulation = [
-        x * (basin_area * 1000000 / 1000 / 3600) for x in best_simulation
-    ]
-    obs = [x * (basin_area * 1000000 / 1000 / 3600) for x in spot_setup.evaluation()]
-    time["starttime"] = pd.to_datetime(time["starttime"])
-    time["endtime"] = pd.to_datetime(time["endtime"])
-    Prcp_list = []
-    W_obs_list = []
-    W_sim_list = []
-    W_bias_abs_list = []
-    W_bias_rela_list = []
-    Q_max_obs_list = []
-    Q_max_sim_list = []
-    Q_bias_rela_list = []
-    time_bias_list = []
-    DC_list = []
-    ID_list = []
-    for i, row in time.iterrows():
-        # for i in range(len(time)):
-        if row["starttime"] < calibrate_endtime:
-            # if(time["starttime",0]<calibrate_endtime):
-            start_num = (
-                row["starttime"]
-                - calibrate_starttime
-                - pd.Timedelta(hours=warmup_length)
-            ) / pd.Timedelta(hours=1)
-            end_num = (
-                row["endtime"] - calibrate_starttime - pd.Timedelta(hours=warmup_length)
-            ) / pd.Timedelta(hours=1)
-            start_period = (row["endtime"] - calibrate_starttime) / pd.Timedelta(
-                hours=1
-            )
-            end_period = (row["endtime"] - calibrate_starttime) / pd.Timedelta(hours=1)
-            start_period = int(start_period)
-            end_period = int(end_period)
-            start_num = int(start_num)
-            end_num = int(end_num)
-            t_range_train_changci = pd.date_range(
-                row["starttime"], row["endtime"], freq="H"
-            )
-            save_fig = os.path.join(save_dir, "train_results" + str(i) + ".png")
-            best_simulation_changci = best_simulation[start_num : end_num + 1]
-            plot_sim_and_obs(
-                t_range_train_changci,
-                best_simulation[start_num : end_num + 1],
-                obs[start_num : end_num + 1],
-                prcp[start_num : end_num + 1],
-                save_fig,
-            )
-            Prcp = sum(prcp[start_num : end_num + 1])
-            W_obs = (
-                sum(obs[start_num : end_num + 1]) * 3600 * 1000 / basin_area / 1000000
-            )
-            W_sim = sum(best_simulation_changci) * 3600 * 1000 / basin_area / 1000000
-            W_bias_abs = W_sim - W_obs
-            W_bias_rela = W_bias_abs / W_obs
-            Q_max_obs = np.max(obs[start_num : end_num + 1])
-            Q_max_sim = np.max(best_simulation_changci)
-            Q_bias_rela = (Q_max_sim - Q_max_obs) / Q_max_obs
-            t1 = np.argmax(best_simulation_changci)
-            t2 = np.argmax(obs[start_num : end_num + 1])
-            time_bias = t1 - t2
-            DC = NSE(obs[start_num : end_num + 1], best_simulation_changci)
-            ID = row["starttime"].strftime("%Y%m%d")
-            Prcp_list.append(Prcp)
-            W_obs_list.append(W_obs)
-            W_sim_list.append(W_sim)
-            W_bias_abs_list.append(W_bias_abs)
-            W_bias_rela_list.append(W_bias_rela)
-            Q_max_obs_list.append(Q_max_obs)
-            Q_max_sim_list.append(Q_max_sim)
-            Q_bias_rela_list.append(Q_bias_rela)
-            time_bias_list.append(time_bias)
-
-            DC_list.append(DC)
-            ID_list.append(ID)
-
-    bias = pd.DataFrame(
-        {
-            "Prcp(mm)": Prcp_list,
-            "W_obs(mm)": W_obs_list,
-            "W_sim(mm)": W_sim_list,
-            "W_bias_abs": W_bias_abs_list,
-            "W_bias_rela": W_bias_rela_list,
-            "Q_max_obs(m3/s)": Q_max_obs_list,
-            "Q_max_sim(m3/s)": Q_max_sim_list,
-            "Q_bias_rela": Q_bias_rela_list,
-            "time_bias": time_bias_list,
-            "DC": DC_list,
-            "ID": ID_list,
-        }
-    )
-    bias.to_csv(
-        os.path.join(
-            "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/train_metrics.csv"
-        )
-    )
-    t_range_train = pd.to_datetime(train_period[warmup_length:]).values.astype(
-        "datetime64[h]"
-    )
-    save_fig = os.path.join(save_dir, "train_results.png")  # 生成结果图
-    plot_sim_and_obs(t_range_train, best_simulation, obs, prcp[:], save_fig)
-
-
-def show_test_result(basin_id, test_date, qsim, obs, save_dir):
-    stat_error = hydro_stat.stat_error(obs.reshape(1, -1), qsim.reshape(1, -1))
-    print("Test Metrics:", basin_id, stat_error)
-    hydro_file.serialize_json_np(
-        stat_error, os.path.join(save_dir, "test_metrics.json")
-    )
-    time = pd.read_excel(
-        "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/洪水率定时间.xlsx"
-    )
-    test_starttime = pd.to_datetime("2020-01-01 00:00:00")
-    test_endtime = pd.to_datetime("2022-08-31 23:00:00")
-    # for i in range(len(time)):
-    #     if(test_starttime<time.iloc[i,0]<test_endtime):
-    #             start_num = (time.iloc[i,0]-test_starttime-pd.Timedelta(hours=warmup_length))/pd.Timedelta(hours=1)
-    #             end_num = (time.iloc[i,1]-test_starttime-pd.Timedelta(hours=warmup_length))/pd.Timedelta(hours=1)
-    #             start_period = (time.iloc[i,0]-test_starttime)/pd.Timedelta(hours=1)
-    #             end_period = (time.iloc[i,1]-test_starttime)/pd.Timedelta(hours=1)
-    #             start_period = int(start_period)
-    #             end_period = int(end_period)
-    #             start_num = int(start_num)
-    #             end_num = int(end_num)
-    #             t_range_test_changci = pd.to_datetime(test_date[start_period:end_period]).values.astype("datetime64[h]")
-    #             save_fig = os.path.join(save_dir, "test_results"+str(i)+".png")
-    #             plot_sim_and_obs(t_range_test_changci, qsim.flatten()[start_num:end_num],obs.flatten()[start_num:end_num], prcp[start_num:end_num],save_fig)
-    Prcp_list = []
-    W_obs_list = []
-    W_sim_list = []
-    W_bias_abs_list = []
-    W_bias_rela_list = []
-    Q_max_obs_list = []
-    Q_max_sim_list = []
-    Q_bias_rela_list = []
-    time_bias_list = []
-    DC_list = []
-    ID_list = []
-    for i, row in time.iterrows():
-        if test_starttime < row["starttime"] < test_endtime:
-            start_num = (
-                row["starttime"] - test_starttime - pd.Timedelta(hours=warmup_length)
-            ) / pd.Timedelta(hours=1)
-            end_num = (
-                row["endtime"] - test_starttime - pd.Timedelta(hours=warmup_length)
-            ) / pd.Timedelta(hours=1)
-            start_period = (row["endtime"] - test_starttime) / pd.Timedelta(hours=1)
-            end_period = (row["endtime"] - test_starttime) / pd.Timedelta(hours=1)
-            start_period = int(start_period)
-            end_period = int(end_period)
-            start_num = int(start_num)
-            end_num = int(end_num)
-            t_range_train_changci = pd.date_range(
-                row["starttime"], row["endtime"], freq="H"
-            )
-            save_fig = os.path.join(save_dir, "test_results" + str(i) + ".png")
-            plot_sim_and_obs(
-                t_range_train_changci,
-                qsim.flatten()[start_num : end_num + 1],
-                obs.flatten()[start_num : end_num + 1],
-                prcp[start_num : end_num + 1],
-                save_fig,
-            )
-            Prcp = sum(prcp[start_num : end_num + 1])
-            W_obs = sum(obs.flatten()[start_num : end_num + 1])
-            W_sim = sum(qsim.flatten()[start_num : end_num + 1])
-            W_bias_abs = W_sim - W_obs
-            W_bias_rela = W_bias_abs / W_obs
-            Q_max_obs = np.max(obs[start_num : end_num + 1])
-            Q_max_sim = np.max(qsim.flatten()[start_num : end_num + 1])
-            Q_bias_rela = (Q_max_sim - Q_max_obs) / Q_max_obs
-            t1 = np.argmax(qsim.flatten()[start_num : end_num + 1])
-            t2 = np.argmax(obs[start_num : end_num + 1])
-            time_bias = t1 - t2
-            DC = NSE(
-                obs.flatten()[start_num : end_num + 1],
-                qsim.flatten()[start_num : end_num + 1],
-            )
-            ID = row["starttime"].strftime("%Y%m%d")
-            Prcp_list.append(Prcp)
-            W_obs_list.append(W_obs)
-            W_sim_list.append(W_sim)
-            W_bias_abs_list.append(W_bias_abs)
-            W_bias_rela_list.append(W_bias_rela)
-            Q_max_obs_list.append(Q_max_obs)
-            Q_max_sim_list.append(Q_max_sim)
-            Q_bias_rela_list.append(Q_bias_rela)
-            time_bias_list.append(time_bias)
-            DC_list.append(DC)
-            ID_list.append(ID)
-
-    bias = pd.DataFrame(
-        {
-            "Prcp(mm)": Prcp_list,
-            "W_obs(mm)": W_obs_list,
-            "W_sim(mm)": W_sim_list,
-            "W_bias_abs": W_bias_abs_list,
-            "W_bias_rela": W_bias_rela_list,
-            "Q_max_obs(m3/s)": Q_max_obs_list,
-            "Q_max_sim(m3/s)": Q_max_sim_list,
-            "Q_bias_rela": Q_bias_rela_list,
-            "time_bias": time_bias_list,
-            "DC": DC_list,
-            "ID": ID_list,
-        }
-    )
-    bias.to_csv(
-        os.path.join(
-            "D:/研究生/毕业论文/new毕业论文/预答辩/碧流河水库/站点信息/test_metrics.csv"
-        )
-    )
-
-    save_fig = os.path.join(save_dir, "test_results.png")
-
-    plot_sim_and_obs(
-        test_date[365:],
-        qsim.flatten(),
-        obs.flatten(),
-        prcp[:],
-        save_fig,
-    )
-
-
-def NSE(obs, mol):
-    numerator = 0
-    denominator = 0
-    meangauge = 0
-    count = 0
-    for i in range(len(obs)):
-        if obs[i] >= 0:
-            numerator += pow(abs(mol[i]) - obs[i], 2)
-            meangauge += obs[i]
-            count += 1
-    meangauge = meangauge / count
-    for i in range(len(obs)):
-        if obs[i] >= 0:
-            denominator += pow(obs[i] - meangauge, 2)
-    return 1 - numerator / denominator
diff --git a/scripts/calibrate_xaj.py b/scripts/calibrate_xaj.py
index 1367c4d..b5599a0 100644
--- a/scripts/calibrate_xaj.py
+++ b/scripts/calibrate_xaj.py
@@ -1,7 +1,7 @@
 """
 Author: Wenyu Ouyang
 Date: 2022-11-19 17:27:05
-LastEditTime: 2024-03-26 18:55:25
+LastEditTime: 2024-03-26 19:53:51
 LastEditors: Wenyu Ouyang
 Description: the script to calibrate a model for CAMELS basin
 FilePath: \hydro-model-xaj\scripts\calibrate_xaj.py
@@ -9,7 +9,6 @@
 """
 
 import json
-import numpy as np
 import argparse
 import sys
 import os
@@ -19,11 +18,9 @@
 
 repo_path = os.path.dirname(Path(os.path.abspath(__file__)).parent)
 sys.path.append(repo_path)
+from datasets.data_preprocess import cross_val_split_tsdata
 from hydromodel.datasets import *
 from hydromodel.datasets.data_preprocess import (
-    cross_valid_data,
-    split_train_test,
-    get_ts_from_diffsource,
     get_pe_q_from_ts,
 )
 from hydromodel.trainers.calibrate_sceua import calibrate_by_sceua
@@ -41,22 +38,22 @@ def calibrate(args):
     basin_ids = args.basin_id
     model_info = args.model
     algo_info = args.algorithm
-    loss = args.loss
-    ts_data = get_ts_from_diffsource(data_type, data_dir, periods, basin_ids)
+    loss_info = args.loss
 
     where_save = Path(os.path.join(repo_path, "result", exp))
     if os.path.exists(where_save) is False:
         os.makedirs(where_save)
 
-    if cv_fold <= 1:
-        # no cross validation
-        periods = np.sort(
-            [train_period[0], train_period[1], test_period[0], test_period[1]]
-        )
-        train_and_test_data = split_train_test(ts_data, train_period, test_period)
-    else:
-        # cross validation
-        train_and_test_data = cross_valid_data(ts_data, periods, warmup, cv_fold)
+    train_and_test_data = cross_val_split_tsdata(
+        data_type,
+        data_dir,
+        cv_fold,
+        train_period,
+        test_period,
+        periods,
+        warmup,
+        basin_ids,
+    )
 
     print("Start to calibrate the model")
 
@@ -70,7 +67,7 @@ def calibrate(args):
             warmup,
             model=model_info,
             algorithm=algo_info,
-            loss=loss,
+            loss=loss_info,
         )
     else:
         for i in range(cv_fold):
@@ -84,7 +81,7 @@ def calibrate(args):
                 warmup,
                 model=model_info,
                 algorithm=algo_info,
-                loss=loss,
+                loss=loss_info,
             )
     # Convert the arguments to a dictionary
     args_dict = vars(args)
diff --git a/scripts/evaluate_xaj.py b/scripts/evaluate_xaj.py
index f529e9c..02cd25a 100644
--- a/scripts/evaluate_xaj.py
+++ b/scripts/evaluate_xaj.py
@@ -1,28 +1,38 @@
+"""
+Author: Wenyu Ouyang
+Date: 2024-03-26 12:00:12
+LastEditTime: 2024-03-26 21:50:14
+LastEditors: Wenyu Ouyang
+Description: 
+FilePath: \hydro-model-xaj\scripts\evaluate_xaj.py
+Copyright (c) 2023-2024 Wenyu Ouyang. All rights reserved.
+"""
+
 import argparse
-import socket
-import fnmatch
-from datetime import datetime
-import numpy as np
-import pandas as pd
 import yaml
 import os
 import sys
 from pathlib import Path
-from hydroutils import hydro_file
+
 
 repo_path = os.path.dirname(Path(os.path.abspath(__file__)).parent)
 sys.path.append(repo_path)
-from hydromodel.trainers.calibrate_sceua import calibrate_by_sceua
-from hydromodel.datasets.data_postprocess import (
+from hydromodel.models.model_dict import MODEL_DICT
+from hydromodel.datasets import *
+from hydromodel.datasets.data_preprocess import cross_val_split_tsdata, get_pe_q_from_ts
+from trainers.evaluate import (
+    save_evaluate_results,
+)
+from hydromodel.trainers.evaluate import (
+    read_all_basin_params,
+)
+from hydromodel.trainers.calibrate_ga import calibrate_by_ga, show_ga_result
+from hydromodel.trainers.evaluate import (
+    convert_streamflow_units,
     renormalize_params,
-    read_save_sceua_calibrated_params,
-    save_streamflow,
     summarize_metrics,
     summarize_parameters,
 )
-from hydromodel.trainers.train_utils import show_calibrate_result, show_test_result
-from hydromodel.models.xaj import xaj
-from hydromodel.trainers.calibrate_ga import calibrate_by_ga, show_ga_result
 
 
 def read_yaml_config(file_path):
@@ -33,95 +43,46 @@ def read_yaml_config(file_path):
 
 def evaluate(args):
     exp = args.exp
-    warmup = args.warmup_length
     cali_dir = Path(os.path.join(repo_path, "result", exp))
     cali_config = read_yaml_config(os.path.join(cali_dir, "config.yaml"))
-    kfold = np.sort(kfold)
-    for fold in kfold:
-        print(f"Start to calibrate the {fold}-th fold")
-        current_time = datetime.now().strftime("%b%d_%H-%M-%S")
-        save_dir = os.path.join(
-            cali_dir,
-            current_time
-            + "_"
-            + socket.gethostname()
-            + "_fold"
-            + str(fold)
-        )
-        # 读输入文件
-        if os.path.exists(save_dir) is False:
-            os.makedirs(save_dir)
-        hydro_file.serialize_json(vars(args), os.path.join(save_dir, "args.json"))
+    kfold = cali_config["cv_fold"]
+    algo_info = cali_config["algorithm"]
+    basins = cali_config["basin_id"]
+    warmup = cali_config["warmup"]
+    data_type = cali_config["data_type"]
+    data_dir = cali_config["data_dir"]
+    train_period = cali_config["calibrate_period"]
+    test_period = cali_config["test_period"]
+    periods = cali_config["period"]
+    model_info = cali_config["model"]
+    train_and_test_data = cross_val_split_tsdata(
+        data_type,
+        data_dir,
+        kfold,
+        train_period,
+        test_period,
+        periods,
+        warmup,
+        basins,
+    )
+    for fold in range(kfold):
+        print(f"Start to evaluate the {fold+1}-th fold")
+        save_dir = os.path.join(cali_dir, f"sceua_xaj_cv{fold+1}")
         if algo_info["name"] == "SCE_UA":
-            for i in range(len(data_info_train["basin"])):
-                basin_id = data_info_train["basin"][i]
-                basin_area = data_info_train["area"][i]
-                # one directory for one model + one hyperparam setting and one basin
-                spotpy_db_dir = os.path.join(  # 一个模型一个文件夹
-                    save_dir,
-                    basin_id,
-                )
-                if not os.path.exists(spotpy_db_dir):
-                    os.makedirs(spotpy_db_dir)
-                db_name = os.path.join(spotpy_db_dir, "SCEUA_" + model_info["name"])
-                show_calibrate_result(  # 展示率定结果
-                    sampler.setup,
-                    db_name,
-                    warmup_length=warmup,
-                    save_dir=spotpy_db_dir,
-                    basin_id=basin_id,
-                    train_period=data_info_train["time"],
-                    basin_area=basin_area,
-                    prcp=data_train[365:, i : i + 1, 0:1].flatten(),
-                )
-
-                params = read_save_sceua_calibrated_params(  # 保存率定的参数文件
-                    basin_id, spotpy_db_dir, db_name
-                )
-                # _ is et which we didn't use here
-                qsim, _ = xaj(  # 计算模拟结果
-                    data_test[:, i : i + 1, 0:2],
-                    params,
-                    warmup_length=0,
-                    **model_info,
-                )
-
-                qsim = units.convert_unit(
-                    qsim,
-                    # TODO: to unify "mm/hour"
-                    unit_now="mm/day",
-                    unit_final=units.unit["streamflow"],
-                    basin_area=basin_area,
-                )
-                qobs = units.convert_unit(
-                    data_test[warmup:, i : i + 1, -1:],
-                    # TODO: to unify "mm/hour"
-                    unit_now="mm/day",
-                    unit_final=units.unit["streamflow"],
-                    basin_area=basin_area,
-                )
-                test_result_file = os.path.join(
-                    spotpy_db_dir,
-                    "test_qsim_" + model_info["name"] + "_" + str(basin_id) + ".csv",
-                )
-                pd.DataFrame(qsim.reshape(-1, 1)).to_csv(
-                    test_result_file,
-                    sep=",",
-                    index=False,
-                    header=False,
-                )
-                test_date = pd.to_datetime(data_info_test["time"][:]).values.astype(
-                    "datetime64[h]"
-                )
-                show_test_result(
-                    basin_id,
-                    test_date,
-                    qsim,
-                    qobs,
-                    save_dir=spotpy_db_dir,
-                    warmup_length=warmup,
-                    prcp=data_test[365:, i : i + 1, 0:1].flatten(),
-                )
+            # evaluate both train and test period for all basins
+            test_data = train_and_test_data[fold][1]
+            test_p_and_e, _ = get_pe_q_from_ts(test_data)
+            params = read_all_basin_params(basins, save_dir)
+            # 计算模拟结果
+            qsim, _ = MODEL_DICT[model_info["name"]](
+                test_p_and_e,
+                params,
+                # we set the warmup_length=0 but later we get results from warmup_length to the end to evaluate
+                warmup_length=0,
+                **model_info,
+            )
+            # 创建 DataArray
+            qsim, qobs = convert_streamflow_units(test_data, qsim, data_type, data_dir)
         elif algo_info["name"] == "GA":
             for i in range(len(data_info_train["basin"])):
                 basin_id = data_info_train["basin"][i]
@@ -155,7 +116,7 @@ def evaluate(args):
                     deap_db_dir,
                     warmup_length=warmup,
                     basin_id=basin_id,
-                    the_data=data_test[:, i : i + 1, :],
+                    the_data=test_p_and_e[:, i : i + 1, :],
                     the_period=data_info_test["time"],
                     basin_area=basin_area,
                     model_info=model_info,
@@ -165,10 +126,10 @@ def evaluate(args):
             raise NotImplementedError(
                 "We don't provide this calibrate method! Choose from 'SCE_UA' or 'GA'!"
             )
-        summarize_parameters(save_dir, model_info)
-        renormalize_params(save_dir, model_info)
-        summarize_metrics(save_dir, model_info)
-        save_streamflow(save_dir, model_info, fold=fold)
+        summarize_parameters(save_dir, model_info["name"], basins)
+        renormalize_params(save_dir, model_info["name"], basins)
+        # summarize_metrics(save_dir, model_info)
+        save_evaluate_results(save_dir, model_info["name"], qsim, qobs, test_data)
         print(f"Finish calibrating the {fold}-th fold")
 
 
@@ -183,12 +144,5 @@ def evaluate(args):
         default="expcamels001",
         type=str,
     )
-    parser.add_argument(
-        "--warmup_length",
-        dest="warmup_length",
-        help="the length of warmup period for hydro model",
-        default=365,
-        type=int,
-    )
     the_args = parser.parse_args()
     evaluate(the_args)
diff --git a/scripts/datapostprocess4calibrate.py b/scripts/post_process.py
similarity index 95%
rename from scripts/datapostprocess4calibrate.py
rename to scripts/post_process.py
index 52615a3..8d3d2c4 100644
--- a/scripts/datapostprocess4calibrate.py
+++ b/scripts/post_process.py
@@ -1,10 +1,10 @@
 """
 Author: Wenyu Ouyang
 Date: 2022-11-19 17:27:05
-LastEditTime: 2024-03-26 15:43:08
+LastEditTime: 2024-03-26 21:32:54
 LastEditors: Wenyu Ouyang
-Description: the script to postprocess calibrated models in hydro-model-xaj
-FilePath: \hydro-model-xaj\scripts\datapostprocess4calibrate.py
+Description: the script to postprocess results
+FilePath: \hydro-model-xaj\scripts\post_process.py
 Copyright (c) 2021-2022 Wenyu Ouyang. All rights reserved.
 """
 
@@ -19,7 +19,7 @@
 
 repo_dir = os.path.dirname(Path(os.path.abspath(__file__)).parent)
 sys.path.append(repo_dir)
-from hydromodel.datasets.data_postprocess import read_and_save_et_ouputs
+from trainers.evaluate import read_and_save_et_ouputs
 
 
 def statistics(args):
diff --git a/test/test_data_postprocess.py b/test/test_data_postprocess.py
index 9d0ffed..720e00c 100644
--- a/test/test_data_postprocess.py
+++ b/test/test_data_postprocess.py
@@ -14,7 +14,7 @@
 import matplotlib.pyplot as plt
 import spotpy
 from spotpy.examples.spot_setup_hymod_python import spot_setup as hymod_setup
-from hydromodel.datasets.data_postprocess import read_save_sceua_calibrated_params
+from trainers.evaluate import read_save_sceua_calibrated_params
 
 
 def test_run_hymod_calibration():
diff --git a/test/test_show_results.py b/test/test_show_results.py
index 09b9e89..be75cba 100644
--- a/test/test_show_results.py
+++ b/test/test_show_results.py
@@ -1,21 +1,25 @@
 """
 Author: Wenyu Ouyang
 Date: 2022-12-08 09:24:54
-LastEditTime: 2024-03-22 20:58:24
+LastEditTime: 2024-03-26 21:29:39
 LastEditors: Wenyu Ouyang
 Description: some util funcs for hydro model
 FilePath: \hydro-model-xaj\test\test_show_results.py
 Copyright (c) 2021-2022 Wenyu Ouyang. All rights reserved.
 """
 
-from hydromodel.datasets.data_postprocess import read_save_sceua_calibrated_params
+from hydromodel.datasets.data_postprocess import (
+    show_sceua_cali_result,
+)
 from hydromodel.models.xaj import xaj
 from hydromodel.trainers.calibrate_sceua import calibrate_by_sceua
-from hydromodel.trainers.train_utils import show_calibrate_result, show_test_result
+from datasets.data_postprocess import show_test_result
 
 
 from hydroutils import hydro_time
 
+from trainers.evaluate import read_save_sceua_calibrated_params
+
 
 def test_show_calibrate_sceua_result(p_and_e, qobs, warmup_length, db_name, basin_area):
     sampler = calibrate_by_sceua(
@@ -39,7 +43,7 @@ def test_show_calibrate_sceua_result(p_and_e, qobs, warmup_length, db_name, basi
         },
     )
     train_period = hydro_time.t_range_days(["2012-01-01", "2017-01-01"])
-    show_calibrate_result(
+    show_sceua_cali_result(
         sampler.setup,
         db_name,
         warmup_length=warmup_length,