shyaginuma · shyaginuma · Jun 2, 2024 · Jun 2, 2024 · Jun 2, 2024 · Jun 2, 2024
diff --git a/casual_inference/evaluator/aatest.py b/casual_inference/evaluator/aatest.py
@@ -1,10 +1,13 @@
+from typing import Union
+
 import numpy as np
 import pandas as pd
 import plotly.express as px
 import plotly.graph_objs as go
 from scipy.stats import kstest
 from typing_extensions import Self
 
+from ..model import CustomMetric
 from ..statistical_testing import t_test
 from .base import BaseEvaluator
 
@@ -30,7 +33,7 @@ def __init__(self, n_simulation: int = 1000, sample_rate: float = 1.0) -> None:
         self.sample_rate = sample_rate
 
     # ignore mypy error temporary, because the "Self" type support on mypy is ongoing. https://github.com/python/mypy/pull/11666
-    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[str]) -> Self:  # type: ignore
+    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[Union[str, CustomMetric]]) -> Self:  # type: ignore
         """split data n times, and calculate statistics n times, then store it as an attribute.
 
         Parameters

diff --git a/casual_inference/evaluator/abtest.py b/casual_inference/evaluator/abtest.py
@@ -1,6 +1,6 @@
 import warnings
 from dataclasses import dataclass
-from typing import Optional
+from typing import Optional, Union
 
 import pandas as pd
 import pandas.api.types as pd_types
@@ -9,6 +9,7 @@
 from scipy.stats import chisquare
 from typing_extensions import Self
 
+from ..model import CustomMetric
 from ..statistical_testing import eval_ttest_significance, t_test
 from .base import BaseEvaluator
 
@@ -41,7 +42,7 @@ def evaluate(
         self,
         data: pd.DataFrame,
         unit_col: str,
-        metrics: list[str],
+        metrics: list[Union[str, CustomMetric]],
         variant_col: str = "variant",
         segment_col: Optional[str] = None,
     ) -> Self:  # type: ignore

diff --git a/casual_inference/evaluator/base.py b/casual_inference/evaluator/base.py
@@ -1,17 +1,20 @@
 from abc import ABC, abstractmethod
+from typing import Union
 
 import pandas as pd
 import plotly.graph_objs as go
 from typing_extensions import Self
 
+from ..model import CustomMetric
+
 
 class BaseEvaluator(ABC):
     def __init__(self) -> None:
         self.stats: pd.DataFrame = pd.DataFrame()
 
     @abstractmethod
     # ignore mypy error temporary, because the "Self" type support on mypy is ongoing. https://github.com/python/mypy/pull/11666
-    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[str]) -> Self:  # type: ignore
+    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[Union[str, CustomMetric]]) -> Self:  # type: ignore
         return self
 
     @abstractmethod
@@ -26,7 +29,7 @@ def _validate_evaluate_executed(self) -> None:
         if self.stats.shape[0] == 0:
             raise ValueError("Evaluated statistics haven't been calculated. Please call evaluate() in advance.")
 
-    def _validate_passed_data(self, data: pd.DataFrame, unit_col: str, metrics: list[str]) -> None:
+    def _validate_passed_data(self, data: pd.DataFrame, unit_col: str, metrics: list[Union[str, CustomMetric]]) -> None:
         if data.shape[0] != data[unit_col].nunique():
             raise ValueError("passed dataframe hasn't been aggregated by the randomization unit.")
         if len(metrics) == 0:

diff --git a/casual_inference/evaluator/linear_regression.py b/casual_inference/evaluator/linear_regression.py
@@ -1,9 +1,12 @@
+from typing import Union
+
 import pandas as pd
 import plotly.express as px
 import plotly.graph_objs as go
 import statsmodels.formula.api as smf
 from typing_extensions import Self
 
+from ..model import CustomMetric
 from .base import BaseEvaluator
 
 
@@ -25,7 +28,7 @@ def evaluate(
         self,
         data: pd.DataFrame,
         unit_col: str,
-        metrics: list[str],
+        metrics: list[Union[str, CustomMetric]],
         treatment_col: str = "treatment",
         covariates: list[str] = [],
     ) -> Self:  # type: ignore
@@ -61,6 +64,8 @@ def evaluate(
             covariates_str = "+ " + "+ ".join(covariates)
 
         for metric in metrics:
+            if isinstance(metric, CustomMetric):
+                raise ValueError("CustomMetric is not supported in this evaluator.")
             model = smf.ols(formula=f"{metric} ~ {treatment_col} {covariates_str}", data=data).fit()
             self.models[metric] = model
 

diff --git a/casual_inference/evaluator/samplesize.py b/casual_inference/evaluator/samplesize.py
@@ -1,11 +1,12 @@
-from typing import Optional
+from typing import Optional, Union
 
 import numpy as np
 import pandas as pd
 import plotly.express as px
 import plotly.graph_objs as go
 from typing_extensions import Self
 
+from ..model import CustomMetric
 from .base import BaseEvaluator
 
 
@@ -14,7 +15,7 @@ def __init__(self) -> None:
         super().__init__()
 
     # ignore mypy error temporary, because the "Self" type support on mypy is ongoing. https://github.com/python/mypy/pull/11666
-    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[str], n_variant: int = 2) -> Self:  # type: ignore
+    def evaluate(self, data: pd.DataFrame, unit_col: str, metrics: list[Union[str, CustomMetric]], n_variant: int = 2) -> Self:  # type: ignore
         """Calculate statistics of metrics and mde with simulating A/B test threshold.
 
         Parameters

diff --git a/casual_inference/model.py b/casual_inference/model.py
@@ -0,0 +1,8 @@
+from dataclasses import dataclass
+
+
+@dataclass
+class CustomMetric:
+    name: str
+    denominator: str
+    numerator: str
diff --git a/casual_inference/statistical_testing.py b/casual_inference/statistical_testing.py
@@ -1,9 +1,15 @@
+from typing import Union
+
 import numpy as np
 import pandas as pd
 from scipy.stats import t, ttest_ind_from_stats
 
+from .model import CustomMetric
+
 
-def t_test(data: pd.DataFrame, unit_col: str, variant_col: str, metrics: list[str]) -> pd.DataFrame:
+def t_test(
+    data: pd.DataFrame, unit_col: str, variant_col: str, metrics: list[Union[str, CustomMetric]]
+) -> pd.DataFrame:
     """_summary_
 
     Parameters
@@ -30,14 +36,16 @@ def t_test(data: pd.DataFrame, unit_col: str, variant_col: str, metrics: list[st
         raise ValueError("metrics hasn't been specified.")
     if data[variant_col].min() != 1:
         raise ValueError("the control variant seems not to exist.")
+    normal_metrics = [metric for metric in metrics if isinstance(metric, CustomMetric) == False]
+    # custom_metrics = [metric for metric in metrics if isinstance(metric, CustomMetric)]
     means = (
-        data.groupby(variant_col)[metrics].mean().stack().reset_index().rename(columns={"level_1": "metric", 0: "mean"})
+        data.groupby(variant_col)[normal_metrics].mean().stack().reset_index().rename(columns={"level_1": "metric", 0: "mean"})
     )
     vars = (
-        data.groupby(variant_col)[metrics].var().stack().reset_index().rename(columns={"level_1": "metric", 0: "var"})
+        data.groupby(variant_col)[normal_metrics].var().stack().reset_index().rename(columns={"level_1": "metric", 0: "var"})
     )
     counts = (
-        data.groupby(variant_col)[metrics]
+        data.groupby(variant_col)[normal_metrics]
         .count()
         .stack()
         .reset_index()